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《集成 电路 热管 理 : 片上 和 系统 级 的 监测 及 冷却 》 全 书 结构 非常 清晰 ， 


电路 热量 产生 为 起 始 ， 以 元 件 升 温 、 高 温 影响 和 传 热 路 径 为 
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热管 理 技术 讲解 和 宝贵 的 热管 理 设计 经 验 都 可 以 在 书 中 找到 。 

的 从 业 人 员 展 开 了 一 幅 热 管理 的 画卷 ， 同 时 也 对 从 业 多 年 的 


轻 轻 地 诉说 着 专业 性 的 技术 。 
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近年 来 ， 由 于 设备 和 元 器 件 的 集成 度 越 来 越 高 、 功 率 密 度 越 来 越 大 ， 热 设计 
变 得 越 来 越 重 要 。 热 设计 工程 师承 担 的 工作 职责 也 越 来 越 多 ， 正 如 当下 热 词 
“一 专 多 能 ”所 描述 的 那样 ， 为 了 能 设计 出 一 款 性 能 卓越 的 产品 ， 热 设计 工程 师 
除了 需要 掌握 热 专 业 相关 的 知识 外 ， 还 需要 了 解 硬 件 、 软 件 算法 、 系 统 架 构 等 专 
业 领 域 的 内 容 。 
目前 市 面 上 的 热 设 计 类 书籍 大 部 分 是 以 热 专 业 为 主 的 书籍 。 本 书 原 作者 以 一 
个 学 者 的 眼界 ， 撰 写 了 一 本 以 热 监 控 和 热管 理 为 主线 ， 从 电子 、 软 件 算法 、 巷 
封装 角度 展开 讨论 ， 揭 示 了 热 监 控 和 热管 理 背 后 的 专业 知识 。 根 据 译 者 多 年 的 从 
业经 验 ， 本 书 可 以 作为 一 本 拓宽 热 设 计 工 程 师 知 识 领域 的 专业 类 书籍 ， 除 了 基本 
的 热管 理 之 外 ， 它 还 会 引导 读者 了 解 更 多 关于 硬件 、 软 件 算法 、 芯 片 封装 类 的 
知识 。 
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翻译 了 第 4、5 章 ， 朱 芳 波 翻 译 了 第 2、6 章 及 其 他 部 分 。 本 书 在 翻译 过 程 中 ， 还 
得 到 了 同行 业 很 多 朋友 的 大 力 帮 助 和 支持 ， 在 此 表示 袁 心 感谢 ! 
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随 着 集成 电路 尺寸 越 来 越 小 、 设 计 越 来 越 复 杂 、 功 率 密 度 越 来 越 高 、 热 耗 越 
来 越 大 ， 如 何 快速 、 高 效 地 处 理 产 生 的 热量 ， 正 在 成 为 电路 电流 和 未 来 集成 电路 
设计 的 最 重要 瓶颈 。 当前 系统 最 大 的 设计 功 耗 ， 也 越 来 越 受 限于 系统 散热 能 力 。 
3& [FL LIE d 38 s E : 片 设计 人 员 ， 应 用 保守 的 设计 祭 量 创造 出 次 优 的 结 吉 果 。 对 于 更 
大 规模 的 应 用 ， 如 设计 出 良好 的 高 性 能 计算 系统 和 数据 中 心 ， 散热 成 本 已 占据 了 
总 用 电 成 本 第 二 的 位 置 ， 可 占 总 用 电 成 本 的 30% ~50% 。 因 此 ， 热 监控 和 热管 
理 正 在 变 得 越 来 越 重 要 。 

本 书 涵盖 了 集成 电路 的 热 监控 和 热管 理 内 容 ， 着 重 介 绍 了 集成 电路 中 芯片 内 
BERRA (相对 于 独立 封装 或 独立 布置 在 电路 板 上 的 传感器 而 言 ) 的 原理 和 材 
料 。 本 书 讨论 的 传感器 装置 和 电路 内 容 主 要 包括 ， 各 种 旨 在 将 采样 温度 转化 为 数 
字 读 显 值 的 装置 以 及 主动 偏 置 电 路 。 主 动 偏 置 电路 旨 在 将 采集 到 的 芯片 温度 梯 
度 ， 反 过 来 用 于 热管 理 。 本 书 探讨 的 主题 包括 : 集成 电路 和 系统 热 问 题 、 芯 片上 
集成 温度 传 感 、 动 态 热管 理 、 主 动 散热 以 及 如 何在 系统 级 以 及 中 心机 房 、 数 据 中 
心 层面 上 解决 以 上 热 问 题 。 
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$135 
集成 电路 和 系统 的 热 问 题 


在 高 性 能 电子 设备 〈( 例 如， 台式 机 、 服 务 器 ) 和 小 尺寸 高 端 移动 设备 〈 如 
智能 手机 ， 平 板 电脑 ) 的 设计 中 ， 功 率 和 散热 的 制约 已 经 成 为 设计 中 重要 的 考 
虑 因素 。 当 前 ， 功 率 密度 及 其 引起 的 热效应 已 经 成 为 大 功率 集成 电路 进一步 小 型 
PERSE CT) 。 由 高 功率 密度 导致 的 热效应 会 迫使 设计 者 进行 保守 设计 ， 预 留 出 
设计 余 量 ， 因 此 只 能 得 到 次 优 的 结果 。 其 性 能 的 差距 相当 于 给 芯片 生产 商 造 成 数 
亿美 金 的 损失 。 而 且 ， 空 间 分 布 不 均匀 的 热流 无 法 通过 均匀 的 被 动 冷却 手段 有 效 
地 散播 到 环境 中 。 因 此 ， 系 统 经 常 采 用 元 余 设 计 ， 导 致 了 成 本 的 上 升 ， 而 且 往往 
需要 加 入 各 种 形式 的 主动 冷却 手段 。 对 于 大 型 数据 中 心 和 超级 计算 机 ， 每 冷却 
LW 的 热量 需要 消耗 0.3 -0.7W 的 冷却 用 电 ， 并 且 这 个 比例 关系 仍 将 处 于 上 升 趋 
3-5) 。 无 论 是 移动 设备 还 是 超级 计算 机 ， 热 对 系统 的 性 能 和 可 靠 性 的 影响 已 
经 成 为 重要 的 问题 ， 同 时 ， 热 也 会 导致 很 高 的 运营 成 本 和 更 加 巨大 的 碳 排放 ， 对 
于 高 性 能 计算 中 心 尤 其 明显 。 

热效应 是 影响 系统 性 能 的 主要 因素 之 一 。 所 有 主要 的 芯片 生产 商都 依据 芯片 
处 于 最 强 性 能 时 的 功 耗 给 出 了 热 设 计 功 率 (TDP). TDP 代表 系统 长 期 执行 典型 
配置 时 所 能 承受 的 最 大 功率 ， 系 统 只 允许 短 时 间 ( 微 秒 数量 级 ) 超过 TDP。 过 
去 的 数 十 年 间 TDP 持续 增长 。 随 着 绝对 TDP 的 增长 ， 产 生 了 另外 一 个 问题 ， 即 
高 性 能 芯片 的 功率 密度 分 布 变 得 非常 不 均匀 ， 尤 其 是 微 处 理 器 。 在 局 部 热点 区 
域 ， 功 率 密 度 甚至 超过 了 300W/cm?， 而 芯片 平均 功率 密度 则 要 低 一 个 数量 
级 [67] 。 热 点 温度 超过 安全 温度 阅 值 (不同 系统 会 不 同 ,范围 在 80 ~ 105% 之 
间 ) ， 从 而 会 激活 动态 热管 理 引 擎 (DTM) 并 触发 系统 降 频 。 同 时 在 运行 期 间 ， 
通过 TOP 表示 的 系统 总 功 耗 会 动态 调节 不 同 计算 核 或 芯片 的 功 耗 ， 从 而 导致 系 
统 性 能 下 降 。 

除了 对 峰值 性 能 的 影响 ， 瞬 时 和 空间 热 压力 的 不 均 会 增加 高 性 能 计算 系统 的 
FBR] ， 更 加 频繁 的 检测 降低 了 系统 的 性 能 !91 。 即 使 硬件 的 失效 可 以 避免 ， 
但 由 巨大 温度 梯度 导致 的 不 同 硬件 中 的 性 能 波动 也 显而易见 。 在 任意 时 刻 ， 同 一 
系统 中 不 同 节点 中 的 芯片 始终 处 于 不 同 功率 状态 ,这 是 由 于 它们 处 于 各 自 的 
DTM 模式 ， 会 导致 负载 的 不 均衡 。 
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1.1 引起 热 挑 战 的 技术 发 展 趋势 


热 问题 的 影响 已 经 成 为 当前 系统 设计 中 的 主要 瓶 贷 ， 其 背后 的 主要 原因 是 系 
统 尺 寸 的 小 型 化 。 热 损耗 和 温度 与 集成 电路 的 热流 密度 直接 相关 。 在 当代 的 技术 
中 ,缩放 因子 s 仍然 作用 于 特征 尺寸 和 电容 性 负载 ， 供 电 电 压 不 再 随 尺寸 的 缩小 
而 降低 ,但 是 功率 也 不 在 随 着 尺寸 的 缩小 而 线性 地 降低 。 当 我 们 考虑 同 尺寸 下 的 
功率 密度 时 ， 其 呈现 出 随 尺寸 因子 的 缩小 而 线性 增加 的 趋势 。 这 导致 了 在 发 片 的 
新 制程 下 功率 密度 不 断 升 高 。 它 预示 着 在 综合 考虑 功率 、 性 能 、 冷 却 手段 时 ， 对 
散热 的 担忧 变 得 日 益 突 出 。 高 温 对 于 蕊 片 来 说 是 极其 危险 的 。 这 其 中 有 很 多 种 原 
因 。 接 下 来 我 们 将 会 详细 讨论 。 


1.1.1 系统 设计 要 求 


在 热 循环 下 ， 主 动 设备 呈现 出 显著 的 性 能 1 中 波动 性 。 这 是 因 金 属 氧 化 物 半 
导体 场 效 应 管 (MOSFET) 两 个 重要 参数 对 温度 有 极 强 的 依赖 性 。MOSFET 的 载 
流 子 迁移 率 和 靖 值 电压 都 随 温 度 变化 。 这 两 个 参数 轮流 决定 MOSFET 中 的 电流 。 
因此 ， 它 们 的 切换 速度 最 终 决定 了 互补 金属 氧化 物 半导体 (CMOS) 门 在 逻辑 电 
路 中 的 延迟 。 互 联 电阻 对 温度 也 非常 敏感 ， 它 会 导致 预期 延迟 的 剧烈 波 
gy uel. 

定时 参数 对 温度 的 依赖 性 给 复杂 系统 的 设计 验证 带 来 了 新 的 挑战 ， 在 不 牺牲 
巨大 的 保护 频带 的 前 提 下 完成 设计 更 是 困难 重重 。 需 要 完全 验证 电路 性 能 和 功能 
的 模型 变 得 非常 复杂 。 它 们 难以 计算 ,这 要 人 么 会 导致 不 可 接受 的 设计 周期 ， 要 么 
不 得 不 接受 近似 的 设计 分 析 。 没 有 考虑 热效应 的 设计 工具 迫使 芯片 设计 者 进行 保 
守 的 设计 和 不 准确 的 估计 ， 其 设计 出 的 次 优 结果 在 时 序 和 功率 上 有 3096 ~ 4096 的 
损失 。 这 种 性 能 的 差距 相当 于 芯片 生产 商 损失 了 数 十 亿美 金 。 此 外 ， 这 个 差距 直 
接 体现 在 剔除 不 合格 产品 后 的 芯片 产量 上 (生产 的 符合 规范 芯片 的 百分比 ) 。 产 
量 的 损失 影响 着 生产 商 和 客户 的 底线 。 每 一 个 废弃 的 芯片 都 会 增加 合格 芯片 的 
成 本 。 

电子 迁移 率 和 四 个 不 同 的 参数 相关 , 它们 又 各 自 和 温度 有 关 : 声 子 散射 系数 
An， 表面 粗糙 度 散射 系数 ws， 体 电荷 库伦 散射 系数 ws ， 界 面 电荷 库仑 散射 系数 
Mino 一 个 广泛 应 用 的 MOSFET 模型 中 定义 了 每 个 参数 和 温度 的 关系 ， 如 下 
Bias US1, 

1 1 


8/2 p1/3 -l/a p2.1 1 
— e 1K es — CT Ew; 
Moh Ms Mu 


e TU EQ. Do TES (1.1) 


cb in 
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(Ves + V4) 


SUP, Vost MOSFET 的 机 源 电压 ; Vu REPL; 7,, 是 氧化 物 厚度 。 
有 效 迁 移 率 可 以 表示 为 
1 1 1 1 al 
= 1.3 
oon ee (RED) mT Ea ree re ; ) 
不 同 的 迁移 项 和 温度 之 间 的 关系 很 复杂 。 但 是 ， 如 果 我 们 着 眼 于 温度 不 低 于 
200K 的 设备 时 ， 它 们 之 间 的 关系 趋 近 于 反比 关系 ， 即 电子 迁移 率 随 着 温度 的 升 
高 而 降低 。 其 关系 可 以 大 致 的 用 如 下 的 近似 模型 表示 [51 ， 
Tu o, mob 
u = Mnom [o (1.4) 
IUP, Mnom EPRE COL Tu 下 的 标准 迁移 率 ; a_ mob 是 缩放 因子 。 
MOSFET 的 阔 值 电压 可 以 用 平 带电 压 Veg 和 费 米 势 由 RITO, Hp 


Vin = Veg * 20g + y 4/26 (1.5) 


Qs kT, (NAN ee. 1s kT, (N 
人 


kT/q 是 热电 压 ; NA 和 No AERTS AMR BARRE; n 是 硅 材 料 的 本 征 载 流 子 浓 
E; 0,. 是 表面 电荷 密度 ，C,. 是 氧化 层 电容 量 。 
决定 温度 的 两 个 主要 电势 可 按 下 式 计算 : 
[T0 ð 
利用 CMOS Eun PAM nd 温度 相关 的 净 系 数 是 一 个 负 
值 ， 它 表明 MOSFET 的 阔 值 电压 随 着 温度 的 上 升 而 线性 减 小 。 国 值 电压 和 温度 
的 关系 同样 可 以 用 一 个 近似 的 模型 表示 如 下 [| ; 
Va T) = Vinnom + ai, (7 - 了 (1.6) 
温度 与 互联 电阻 的 关系 也 是 线性 的 ， 同 时 温度 正比 于 与 材料 相关 的 经 验 系数 
ag, B 


(1.2) 


式 中 


nom ) 


RCT) SUI + aRlT = 7) | (1.7) 
在 标 称 温度 了 下， 上 述 的 每 一 个 性 能 参数 都 可 以 被 评估 ， 也 可 以 建立 一 个 
典型 的 案例 对 典型 的 电路 延迟 进行 评估 。 但 是 ， 随 着 热 响 应 在 空间 和 时 间 上 多 样 
性 的 加 剧 ， 集 成 电路 的 均匀 性 角 评估 不 再 有 效 。 尤其 是 度 梯度 同时 
在 不 同 器 件 上 引发 热 响 应 延迟 变化 ， 并 最 终 导致 时 序 违 规 时 , 性 能 评估 变 得 更 加 
难以 预测 。 
一 个 极端 的 例子 是 和 温度 的 负 响应 现象 加 2 。 如 前 所 述 ， 温 度 对 载 流 子 迁 
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移 率 和 赣 值 电压 都 有 反 向 的 影响 。 然 而 最 终 的 门 延迟 行为 决定 于 逻辑 门 的 具体 运 
行 条 件 ， 因 为 这 决定 了 在 不 同情 况 下 的 主导 参数 。 例 如 ， 当 一 个 门 的 运行 在 接近 
电源 电压 的 高 阔 值 电压 水 平时 ， 温 度 升 高 导致 的 阔 值 电压 降低 成 为 主导 因素 ， 这 
会 使 得 栅 极 漏电 流 增 加 ， 并 导致 门 延迟 提高 。 但 是 栅 极 运行 在 一 定 范围 ， 该 范围 
内 阔 值 电压 和 电源 电压 之 间 差 距 很 大 时 ， 栅 极 漏电 流 主要 受 载 流 子 迁 移 率 影响 ， 
载 流 子 迁移 率 也 和 温度 负 相 关 。 因 此 ， 在 这 种 情况 下 ， 随 着 温度 的 上 升 ， 延 迟 反 
而 会 下 降 。 

在 很 大 的 温度 范围 内 对 数字 电路 进行 评估 和 优化 ， 同 时 确保 评估 优化 完成 后 
的 时 序 合理 ， 这 项 工作 充满 挑战 。 因 此 ， 由 热 导 致 的 性 能 参数 变化 在 近 些 年 引起 
了 大 量 的 关注 ， 有 很 多 的 关于 如 何 量化 和 减少 时 序 冲 突 的 研究 ， 既 包括 在 延迟 路 
径 上 和 时 钟 数 网 络 上 ， 也 包括 在 微 架 构 块 上 [2 -28] 。 


1.1.2 产品 可 靠 性 要 求 


温度 可 以 有 多 种 方式 造成 芯片 、 封 装 和 集成 电路 等 器 件 的 损坏 。 与 热 应 力 和 
损坏 相关 的 主要 失效 机 理 包括 电 迁 移 、 负 癌 偏 差 温 度 不 稳定 性 (NBTI) 、 压 力 迁 
移 、 依 赖 于 时 间 的 介 电 击 穿 (TDDB) 和 热 循环 !3] 。 
1.1.2.1 温度 对 电 迁 移 的 影响 

电 迁 移 是 相互 连接 最 主要 的 损坏 机 理 [3?-32] 。 在 高 电流 密度 下 扩散 的 金属 离 

会 被 传导 的 电子 取代 ， 从 而 产生 空洞 。 由 这 些 空 队 导致 的 金属 互 连 的 厚度 减 
少 ， 使 互 连 的 电阻 率 会 恶化 导致 延迟 增加 。 这 可 能 会 导致 其 他 正确 设计 和 和 定时 电 
路 产生 时 序 违规 。 在 金属 变 薄 的 地 方 ， 电 流 密度 会 进一步 增加 ， 加 速 磨损 ， 最 终 
导致 金属 的 击 穿 和 致命 的 缺陷 。 离 子 的 扩散 系数 与 温度 呈 指 数 关 系 ， 使 温度 成 为 
电 迁 移 的 主要 动力 。 它 们 的 关系 可 以 用 系数 D, WEE, WRAEK k A 
温度 来 表示 [21 ， 如 下 : 


D = Doe™ (1.8) 
电 迁 移 反 过 来 也 会 影响 整个 芯片 的 可 靠 性 ， 它 可 以 通过 测量 具体 连接 的 平均 
无 故障 时 间 (MTTF) 来 计算 得 到 3]. 


=E; 


= AjJ"ie V (1.9) 


1 
MTTF gy, 
式 中 ,4; 是 一 个 正比 于 导线 横 截 面积 的 系数 ;J 是 根据 试验 常数 n 修正 过 的 电流 
密度 。 温 度 和 MTTF 旦 指数 关系 ， 所 以 芯片 的 热 状 态 成 了 影响 可 靠 性 的 重要 因 
素 。 研 究 指出 ， 由 温度 引起 的 可 靠 性 问题 在 未 来 的 技术 中 会 影响 到 电路 的 
性 能 [34 -36] : 
11.2.2 晶体 管 中 温度 引发 的 不 稳定 性 
NBTI 表现 为 MOSFET 的 整体 质量 的 退化 ， 特 别 表现 在 增加 的 阅 值 电压 、 降 
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低 的 漏电 流 和 跨 导 。 它 并 不 是 致命 的 缺陷 ,但 是 可 以 导致 显著 偏离 预期 的 性 能 参 
数 ， 使 电路 时 序 违规 。 在 负 偏 差 、 温 度 不 断 升 高 的 条 件 下 ， 运 行 MOSFET 器 件 
是 产生 这 种 现象 的 主因 。 热 条 件 超过 100% 通常 定义 为 高 应 力 。 因 此 ， 对 于 p 15 
道 金属 氧化 物 半导体 (PMOS) 晶体 管 而 言 ， 这 是 非常 显著 的 。 因 为 它们 与 开关 
之 间 相 差 一 个 负 机 源 电压 。 在 负 偏差 存在 的 条 件 下 ， 升 高 的 温度 被 认为 是 导致 界 
面 陷阱 和 氧化 物 电 荷 积累 的 原因 !37] 。NBTI 效应 导致 的 阔 值 电压 变化 值 ， 可 以 用 
栅 极 源 电 压 Ves, FASEIN TA] c, 活化 能 已 (0.9 ~1.2eV) 和 两 拟 合 参数 m Mn K 
ZO. ， 即 


AV, cc Va tne™ (1. 10) 

关于 NBTI 引起 的 MTTF 的 一 个 可 能 的 定义 方式 为 : 阔 值 电压 降低 到 某 一 个 
特定 数值 所 需要 的 时 间 。 基 于 这 个 定义 ,， NBTI 效应 导致 的 MTTF 和 温度 之 间 遵 
循 如 下 关系 : 


B E 
MTTF yg © Mygr (+) em (1. 11) 
GS 


式 中 ，MNsm 是 一 个 技术 相关 的 参数 ; B 为 电压 加 速 因子 (一 般 为 6 ~8)。 
1.1.2.3 热 应 力 引 起 的 机 械 形 变 

热 应 力也 会 导致 在 芯片 内 置 的 元 件 (如 介 电 层 ) 出 现 应 变 和 变形 ， 非 芯片 
内 置 器 件 〈 如 用 于 连接 芯片 和 PCB 或 是 封装 元 件 铜 凸 块 ) 也 一 样 。 

应 力 迁 移 是 指 由 于 不 同 材料 的 热膨胀 差异 导致 的 失效 机 理 。 这 种 差异 导致 金 
属 原子 异 位 (迁移 ) 。 电 迁移 是 由 电荷 (RMT) 相互 作用 引起 的 ， 应 力 迁 移 纯 
粹 是 由 机 械 应 力 引 起 的 。 因 此 ， 这 种 失效 会 影响 金属 互 连 。 应 力 迁 移 可 以 被 近似 
为 遭受 的 温度 分 布 T、 人 金属 的 标 称 温度 (在 沉积 时 ) Ti 和 材料 依赖 常数 m HER 
数 ， 即 


MIT Fg «| T. = TI- ed (1. 12) 
在 时 间 的 过 程 中 ， 穿 过 栅 极 氧化 层 的 电场 会 导致 材料 中 的 磨损 。 总 体 而 言 ， 
磨损 是 由 现 有 层 的 杂质 和 缺陷 引起 的 ， 它 允许 微量 泄漏 电流 通过 。 因 为 栅 极 端子 
连续 偏 压 ， 通 过 电场 的 隧道 电流 导致 形成 新 的 缺陷 。 随 着 时 间 的 推移 ， 缺 陷 增长 
到 一 定 程 度 时 会 导致 氧化 层 完 全 击 穿 。 随 着 技术 缩放 的 栅 极 氧化 物 注 膜 厚度 也 有 
所 萎缩 ， 进 一 步 加 速 了 这 一 效应 ， 特 别 是 薄 氧 化 层 小 于 6nm 时 。 实 验 研 究 表明 ， 
温度 对 材料 降解 有 深刻 的 影响 [3] 。 这 一 缺陷 形成 过 程 之 间 的 关系 ， 也 被 称 为 
TDDB 及 其 相关 的 平均 无 故障 时 间 可 以 被 近似 [38] 为 
4c 
(Ves) zc 
式 中 ，MTTFipps 是 一 个 经 验 技术 常数，Ac 是 机 极 氧 化 物 表面 积 ; a, BA y 是 拟 


y 


MTTF ipp c Mrpps Cram (1. 13) 
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合 得 到 的 参数 。 

最 后 ， 与 温度 紧密 相关 的 最 终 失 效 机 理 是 热 循环 现象 。 热 循环 现象 是 指 在 一 
定时 间 段 内 芯片 处 于 显著 的 温度 波动 。 集 成 电路 在 开关 机 和 重启 时 常 处 于 这 种 状 
态 。 此 外 ， 瞬 时 的 热 梯度 非常 陡峭 ， 源 于 各 种 功率 和 性 能 管理 机 制 。 这 些 管理 机 
制 可 以 剧烈 的 改变 功 耗 ( 例 如， 从 高 负载 状态 到 待机 /休眠 状态 , 或 是 超频 状 
d). 。 同 时 ， 剧 烈 地 改变 负载 的 种 类 也 会 导致 热 循 环 。 在 各 种 热 循 环 中 ， 突 然 的 
加 热 和 降温 会 给 特定 元 器 件 造 成 应 力 ， 比 如 PCB 接口 处 的 塑料 封装 和 焊 球 器 件 。 
应 力 可 以 导致 结构 的 变形 ， 并 最 终 导致 致命 的 损坏 。 较 长 时 间 的 热 循环 现象 更 好 
理解 ， 关 于 失效 机 制 可 按照 如 下 模型 估算 : 


1 Y 
MITFy, = (————) (1.14) 


ave Dai 
式 中 ，7, 是 热 循 环 过 程 中 的 平均 温度 ; 7 是 环境 温度 ; y 是 和 材料 相关 的 经 
验 指数 。 
1.1.2.4 温度 对 可 靠 性 的 全 局 影响 

由 各 种 单独 失效 机 制定 义 的 MTTF 可 以 孤立 地 进行 评估 ， 或 者 组 合 起 来 评估 
对 可 靠 性 的 全 局 影响 。 对 某 种 给 定 的 芯片 而 言 ， 由 各 种 失效 导致 的 失效 率 可 以 加 
总 到 一 起 得 到 总 的 失效 率 。 另 一 种 用 来 量化 分 析 温 度 和 可 靠 性 的 简化 模型 ， 采 用 
指数 关系 函数 。 该 关系 函数 实际 上 源 自 于 Arrhenius 方程 ， 方 程 中 定义 了 化 学 系 
统 中 的 与 温度 相关 的 反应 速率 因子 Al, B 

b zs ti.i5) 

MTTF 反比 于 反应 速率 , 它 表 明 温 度 每 升 高 10%C ，MTTF 会 大 概 减少 
一 半 139,40] 

其 他 系统 元 件 的 特定 的 MTTF 和 操作 温度 的 相关 性 也 有 相应 的 研究 。 一 项 研 
究 结 果 表 明 ， 环 境 温度 每 超过 设计 规范 SC ， 硬 盘 的 失效 概率 提高 15% [4 。 


1.1.3 产品 性 能 要 求 


温度 对 性 能 有 两 种 不 同 的 影响 。 对 任何 运行 在 高 温 的 IC 元 件 的 直接 影响 是 
有 源 噩 件 的 延迟 和 互 连 最 有 可 能 变 差 ， 这 是 由 前 面 章 节 讨 论 的 阔 值 电压 、 阻 抗 等 
与 温度 之 间 的 关系 导致 的 。 因 此 ， 在 高 温 下 芯片 的 性 能 将 降低 ， 从 而 逼迫 设计 师 
在 设计 时 不 得 不 采用 保守 的 设计 留 足够 的 余 量 来 应 对 变化 。 甚 至 在 平均 温度 下 很 
大 一 部 分 性 能 会 被 闲置 。 同 时 漏电 功率 对 温度 有 很 强 的 依赖 性 。 因 此 ， 随 着 工作 
温度 的 增加 ， 浪 费 在 漏电 部 分 的 功率 预算 在 有 限 的 整体 功 耗 预算 中 的 比重 会 越 来 
越 大 。 特 别 是 对 于 已 经 批量 使 用 的 多 核 处 理 器 芯片 ， 一 不 小 心 就 会 造成 发 热 不 均 
勺 ， 这 可 能 会 导致 某 些 子 咒 件 处 于 空 载 ， 而 其 他 处 于 高 热 压 力 下 的 计算 核心 承担 
了 大 部 分 世 片 功 耗 。 
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在 处 理 器 中 能 观察 配备 的 DTM 对 温度 有 间接 且 显著 的 影响 。DTM 机 制 通过 
在 芯片 上 内 传感器 监控 芯片 的 温度 ， 并 在 温度 超过 阔 值 时 进行 干预 ， 从 而 力求 避 
免 或 减少 先前 描述 的 可 靠 性 问题 。DTM 可 以 缓解 系统 性 能 的 下 降 ， 在 冷却 能 
不 足 时 降低 芯片 的 热 负荷 。 在 商业 产品 [人 *-*%1 中 ， 这 种 干预 通常 通过 降低 芯片 的 
时 钟 频率 和 电压 来 实现 ， 这 称 为 动态 电压 和 频率 缩放 (DVFS)。 虽 然 性 能 节 流 
是 一 个 有 效 的 手段 ， 用 以 保持 安全 的 运行 状态 ， 但 是 它 的 代价 是 有 意 地 降低 系统 
运行 速度 。 必 须 指 出 的 是 ， 动 态 干预 机 制 可 以 由 局 部 热点 触发 ， 即 使 大 部 分 的 
IC 的 其 余 操 作 温 度 低 于 峰值 温度 点 。 例 如 一 些 热管 理 系统 ， 即 使 器 件 超 温 只 是 
由 单 核心 的 一 个 特定 的 传感器 触发 ，DVFS 也 会 对 所 有 的 计算 核心 进行 干预 。 因 
此 ， 局 部 热点 可 能 会 影响 整个 系统 ， 迫 使 系统 牺牲 一 个 显著 的 计算 周期 的 一 部 
分 。 作 为 一 个 结果 ， 这 些 干预 措施 保护 和 硬件， 防止 致命 的 失败 ， 并 减少 冷却 的 能 
源 ， 但 将 不 可 避免 带 来 性 能 降低 和 变化 。 人 性 能 的 变化 对 高 性 能 计算 系统 有 非常 不 
利 的 影响 。 在 一 个 典型 的 HPC 系统 中 ， 由 于 在 处 理 器 泄漏 和 冷却 性 能 的 不 同 ， 
两 个 节点 可 以 处 于 不 同 的 热 状 态 。 这 种 不 平衡 会 导致 可 能 在 36. 38% ~ 56. 2596 
的 时 间 内 其 中 一 个 节点 相 较 于 男 一 节点 处 于 性 能 较 低 的 状态 。 此 外 ， 这 个 降 频 可 
能 是 由 于 一 个 线程 的 活动 导致 的 ， 而 且 它 占 总 执行 时 间 的 一 部 分 。 最 终 ， 本 系统 
降 频 的 影响 会 导致 整体 性 能 下 降 2. 9% 和 56.9% ,而且 还 会 在 大 范围 内 进行 不 可 
以 预测 的 扩散 。 


1.1.4 成 本 、 用 户 体 验 和 经 济 性 要 求 


高 热流 密度 的 热效应 导致 世 片 设计 者 不 得 不 进行 保守 设计 ， 留 足 余 量 选择 次 
优 的 方案 。 性 能 的 差距 相当 于 芯片 生产 商 损失 了 数 亿 美金 。 此 外 ， 空 间 分 布 不 均 
匀 的 热源 很 难 通过 平均 的 被 动 散热 手 息 有效 地 散 掉 。 例 如 散热 器 ， 往 往 采 用 过 余 
设计 而 导致 逢 本 上 升 。 一 个 用 来 评价 被 动 冷却 [包括 竖 直 组 合 的 均 热 板 ， 界 面 
材料 (TIM) 和 散热 器 ] 效率 的 指标 是 环境 到 结 的 等 效 热 阻 。 热 阻 值 等 于 结 温和 
环境 温度 之 差 除 以 芯片 的 功率 。 对 于 峰值 功 耗 在 20W 左右 的 低 端 〈 约 700MHz) 
处 理 器 ， 其 最 高 许 用 温度 和 环境 温度 之 间 相 差 530" ， 所 需要 的 热 阻 最 大 为 
2%C/AW。 通 过 优化 散热 絮 的 结构 和 选用 创新 的 材料 和 设计 可 以 满足 成 这 个 热 阻 值 
的 要 求 。 但 是 这 会 带 来 成 本 的 上 升 。 例 如 ， 英 特 尔 奔 腾 4 处 理 器 推荐 的 散热 器 ， 
都 采用 导热 硅 脂 界面 材料 ， 其 价格 跨度 达到 3 倍 。 选 择 界面 材料 的 过 程 中 也 存在 
相似 的 材料 和 生产 成 本 的 权衡 。 用 于 处 理 顺 封装 材料 是 两 种 常见 的 导热 硅 脂 、 相 
变 材料 (PCM) 。 各 种 化 合 物 制 成 的 导热 胶 是 由 氧化 笑 、 硅 、 铝 和 其 他 金属 氧化 
物 混 合 而 成 的 。 虽 然 相 变 材 料 的 热 性 能 优 于 导热 硅 脂 ， 但 导热 硅 脂 的 应 用 更 加 简 
单 并 且 制 造成 本 较 少 。 

此 外 ， 除 了 散热 器 大 多 数 高 端 计 算 系 统 还 使 用 额外 的 冷却 方式 。 桌 面 系统 和 
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服务 器 采用 了 风扇 ， 而 有 些 数据 中 心 的 服务 器 则 采用 了 液 冷 技术 。 系 统管 理 人 员 
是 非常 积极 地 想 降 低 冷 却 能 源 成 本 ， 因 为 这 也 是 总 运营 成 本 中 重要 的 一 部 分 。 在 
节能 减 排 3 51 方面， 商业 数据 中 心 和 超级 计算 中 心 面临 巨大 的 压力 。 这 使 得 热 
效应 成 为 首要 的 设计 和 成 本 考虑 因素 。 

热 影响 也 影响 最 终 用 户 对 计算 设备 的 满意 度 。 另 一 个 长 期 的 非 计算 相关 的 运 
行 质 量 基 准 是 噪声 要 求 。 世 片 封 装 内 部 更 高 效 热 解 决 方案 和 成 熟 的 DTM 系统 有 
助 于 冷却 风扇 运 行 在 较 低 的 速度 ， 这 反 过 来 又 降低 了 噪声 。 

热 感知 的 设计 和 管理 在 移动 手持 设备 领域 也 正在 变 得 越 来 越 重要 。 当 人 们 接 
触 温度 超过 45% 17797 的 设备 时 都 会 有 灼热 感 ， 这 在 移动 设备 中 非常 常见 。 例 
如 ,已 经 有 用 户 投 诉 ， 在 玩 图 形 密集 型 游戏 时 ， 平板 电脑 外 完 很 效 ， 据 报道 平板 
电脑 最 热点 温度 能 达到 4790097, 事实 上 ,许多 智能 手机 [1 都 收 到 过 温度 过 
高 的 投诉 。 因 此 ， 热 效应 对 计算 领域 的 高 性 能 集成 电路 的 生产 和 成 本 影响 深远 。 

移动 设备 制造 商 正 在 研究 导入 新 材料 到 他 们 的 产品 中 ， 以 改善 用 户 体验 ， 并 
防止 热 导致 的 不 适 。 在 智能 手机 盖 的 内 侧 尾 盖 封 装 好 的 相 变 材料 可 能 是 一 种 选 
PE?) 。 涂 层 区 域 的 形状 〈 如 果 需 要 大 面积 涂 覆 ， 需 要 注意 到 对 于 不 同 的 手机 和 
平板 电脑 其 涂 覆 区 域 是 不 规则 的 ) 将 是 影响 设计 和 生产 成 本 新 的 考量 因素 。 
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集成 电路 中 的 功率 最 终 会 转化 为 热 。 在 集成 电路 中 给 定 的 区 域 ， 有 两 种 产生 
热 的 主要 途径 。 首 先 ， 有 源 和 无 源 需 件 功率 耗 散 产生 的 热量 ， 其 次 ， 每 个 组 件 和 
其 附近 的 其 他 组 件 的 热 耦合 ， 这 可 能 是 环境 中 的 空气 、 同 一 个 块 主板 上 的 其 他 央 
件 、 整 个 机 架 的 影响 等 。 集 成 电路 中 的 总 功 耗 由 动态 功 耗 pu 和 漏电 功 耗 me 组 
成 。 严 并 设计 的 电路 中 主导 动态 功率 大 小 的 因素 是 电容 式 开 关 ， 它 可 以 表示 为 容 
性 负载 C1 、 承 载 节 点 激活 因子 a、 时 钟 频 率 f 和 电源 电压 多 4 的 函数 ， 即 
Payn = AC Via f (1. 16) 
另 一 方面 , WEIKAAM AFA PT RE E, HA ME (H TE 
漏 ，PN £p EIU, PUA RN Dis c DET A PAE 8d (ELTE T ES i 
件 的 泄漏 ， 它 是 有 源 设备 参数 的 函数 ， 也 是 环境 因素 的 函数 ， 如 温度 。 
lag = Kel NT) (t= e CAP) (1. 17) 
SUH, 1s 代表 一 个 包含 几何 技术 特征 的 电流 因子 ; Vos AE, Va Ze AEE 
FE; Vsoa 是 一 个 集 总 电压 ， 它 是 涉及 线 弹 性 体 效 应 和 漏 势 驳 降 低 效应 1”| 的 一 个 
副 效应 ; Vr =kT/q 是 热电 压 ， 它 的 值 和 温度 有 关 。 
在 主要 的 漏电 流 元 器 件 当 中 ，PN 结 反 向 偏 置 电流 和 温度 旦 指数 关系 ， 同 时 
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主导 现代 设备 关 态 泄露 的 亚 阔 值 漏电 流 和 温度 呈 线 性 函数 关系 ， 同 时 也 受到 阔 值 
电压 Wi 的 有 影响。 这 使 得 功 耗 、 发 热 和 温度 变 成 了 循环 关系 。 高 温 导 致 更 多 的 汇 
漏 ， 而 泄漏 进一步 影响 了 发 热量 和 温度 。 在 极端 情况 下 ， 系 统 无 法 以 快速 地 散 掉 
积聚 的 热量 ， 降 低 器 件 的 温度 ， 将 导致 热 失控 好 ] 。 当 一 个 芯片 无 法 最 终 稳 定 在 
一 个 稳定 的 温度 ， 而 其 漏电 功率 处 在 随 温度 不 断 攀 升 的 状态 ， 这 种 状态 被 称 为 热 
失控 状态 。 如 果 没 有 断 电 ， 这 将 会 导致 攻 片 和 封装 的 永久 性 伤害 。 
动态 功率 和 泄漏 功率 的 和 就 是 芯片 总 功 耗 ， 即 
Pitotal = Pays + Pleak (1. 18) 
芯片 的 发 热量 和 功率 密度 呈正 比 ， 热 传导 机 制 决定 了 耗 散 率 、 瞬 时 热 事件 和 
最 终 的 稳 态 温度 。 这 种 机 制 可 以 用 如 下 的 傅 里 叶 定 律 表示 : 


E E 
" 


(1.19) 


式 中 ， 热 流 密 度 g 和 温度 的 梯度 成 正比 ， 和 材料 的 导热 系数 成 正比 。 换 名 话说 ， 
热流 密度 和 温度 梯度 与 热 阻 7, 的 比值 成 正比 。 负 号 是 表明 了 热流 的 方向 和 温度 梯 
度 的 方向 相反 。 实 际 上 ， 有 源 器 件 的 温度 在 其 瞬时 热 响应 过 程 中 是 高 于 环境 温度 
的 ， 在 稳定 无 源 状 态 下 与 环境 温度 相同 。 因 此 ， 热 总 是 从 芯片 内 部 流向 环境 。 热 
流 密 度 就 等 于 必 乒 的 功率 密度 。 

空间 中 任意 一 点 r+ = (x, y, z) 处 的 功率 密度 为 Pu ， 热 源 的 热流 密度 和 温 
度 的 关系 可 以 用 泊 松 方程 表示 : 


Va =- k, VT(r) - Pus Gu) -pC ED (1.20) 


AP, p 和 C 材料 的 密度 和 比热容 。 式 (1.20) 中 偏 微 分 方程 (PDE) WERE 
空间 某 点 的 瞬 态 温度 。 在 稳 态 下 ， 世 片 向 环境 散 出 的 热量 等 于 电路 本 身 的 发 热 
量 。 这 是 热 稳 态 系统 的 一 个 基本 的 边界 条 件 。 因 此 ， 在 稳 态 下 ， 消 掉 对 时 间 的 导 
数 项 ， 从 而 得 到 如 下 简化 的 偏 微分 方程 : 


V?T(r) =- 


表 1.1 列 出 了 热 相关 的 参数 及 其 单位 。 表 1. 2 列 出 了 在 商用 系统 中 这 些 量 的 
典型 取 值 范围 。 具 有 代表 性 的 最 高 功 耗 来 自 于 业界 主流 芯片 规格 书 中 给 出 的 TDP 
值 。 芯 片 平均 功率 密度 的 范围 是 通过 代表 性 的 芯片 中 最 大 的 尺寸 计算 出 来 
的 [5,361 。 芯 片 局 部 热点 的 功率 密度 远 超过 平均 功率 密度 ， 已 经 达到 数 百 Wm, 

表 1.1 芯片 热 状 态 相 关 的 量 


Path) 
a (1.21) 


热 相关 的 量 单位 
Q: 热量 J 
P. 热流 率 W 


q: 热流 密度 W/m? 
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( 续 ) 

热 相关 的 量 单位 
:导热 系数 W/(m * K) 
R: 热 阻 K/W 
C: 单 位 质量 比热容 J/(kg + K) 
Pp: 材料 的 密度 kg/m? 
7: 温 度 K 
AT ii EE PS RE K 

表 1.2 实际 系统 元 器 件 的 典型 取 值 范 围 
热 相 关 的 量 范围 
P: 热流 率 服务 器 用 的 多 核 处 理 器 芯片 (CCMP) (45 ~22nm) 


单 颗 芯片 的 最 大 值 : 15 -300W 
核 的 数量 (2 ~61 ) 
移动 设备 (平板 电脑 , 智能 手机 ) (45 ~32nm) 
单 颗 芯 片 最 大 值 : 4 ~35W 
核 的 数量 (2 ~4) 
q: 热流 密度 10 ~ 50W/em? (芯片 平均 ) 
局 部 热点 可 达 数 百 W/cm? 
ky 导热 系数 硅 : 150W/(m - K) 
Eti]: 400W/(m - K) 
日 合金; 120 -240W/ ( m - K) 
j 材 料 ( 高 档 导热 硅 脂 ) : 24 8W/(m * K) 
面 材料 ( 相 变 材 料 ) : 3W/(m * K); 20W/(m - K) 有 较 高 的 材料 


= 
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1.2.1 高 性 能 芯片 的 热 响 应 示例 


在 我 们 讨论 由 各 种 技术 〈 例 如 2D 对 比 3D) 生产 的 集成 电路 的 热 积聚 和 热 
传导 问题 之 前 ， 先 看 一 张 典型 的 热 啊 应 案例 的 图 片 〈 见 图 1.1) ， 它 会 给 我 们 一 
些 直 观 的 感受 。 下 面 将 会 展示 高 功率 芯片 在 不 同 操作 条 件 下 的 有 代表 性 的 温度 响 
应 。 这 些 图 片 显 示 了 在 时 间 和 空间 的 动态 管理 机 制作 用 下 忌 片 温度 怎样 随 载 荷 、 
世 片 物理 位 置 的 变化 。 

图 1.1 是 由 仿真 得 到 的 一 个 16 核 的 处 理 器 的 温度 云图 。 处 理 需 芯片 内 部 温 
度 不 仅 在 空间 上 各 不 相同 ， 而 且 也 会 随 着 时 间 剧 烈 变化 。 这 张 图 片 展示 了 一 颗 多 
核 处 理 器 的 重 载 下 的 温度 分 布 。 高 温 的 峰值 代表 热点 。 所 有 当代 的 处 理 融 都 有 内 
置 的 温度 传 感 带 ， 就 是 为 了 保证 芯片 内 热点 低 于 预先 设 定 的 国 值 。 如 果 超 过 立 
值 ， 就 会 触发 芯片 整体 或 部 分 运行 速度 降低 。 这 不 可 避免 地 影响 了 系统 的 性 能 ， 
尤其 是 系统 内 部 功率 不 均匀 导致 出 现 局 部 热点 时 ， 这 种 影响 更 为 明显 。 

从 图 1.2 中 是 体现 不 同 负载 下 不 同 热点 分 布 的 又 一 个 例子 。 在 这 个 例子 中 ， 
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图 1.1 由 仿真 得 到 的 一 个 16 WAE TEER P E ENR S 
=| a n ER y B 
热点 存在 于 不 同 的 位 置 ， 可 以 观察 到 显著 的 温度 梯度 
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图 1.2 一 颗 16 EG Hr fe 16 种 不 同 载荷 下 的 热点 分 布 〈 温 度 值 超过 82°C 的 点 ) 
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热点 是 指 在 一 个 给 定 的 负载 下 ， 最 终 达 到 的 稳 态 温度 值 超 过 限定 温度 (827) 
的 点 。 图 1.2 呈现 了 在 16 种 不 同 载荷 作用 下 的 所 有 热点 。 在 案例 中 ， 在 16 种 载 
荷 的 作用 下 共 观 察 到 了 667 个 热点 ， 它 们 的 温度 分 布 在 82 ~ 117% 之 间 。 图 1.3 
在 一 个 计算 核心 的 平面 图 上 二 加 呈现 了 这 667 个 热点 。 从 这 个 例子 可 以 看 出 ， 热 
点 更 频繁 地 出 现在 了 一 个 计算 核心 的 某 些 子 模块 中 〈 例 如 ， 整 形 和 浮 点 数 执行 
单元 、 寄 存 器 、 数 据 缓 存 ) ， 还 可 以 看 出 不 同 种 类 的 载荷 产生 的 热点 出 现 的 数量 
不 一 样 ， 并 且 热 点 出 现 的 位 置 也 不 同 。 
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IntMap IntQ 

FPMul 

EPReg LdStQ IntExeé, 

FPQ 
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图 1.3 16 核 处 理 天 在 同 载荷 下 的 热点 被 三 加 到 了 一 个 计算 核心 的 平面 网 上 。 
热 啊 应 基于 两 种 因素 : 一 是 负载 相关 的 〈 基 于 这 个 原因 在 不 同 负载 下 产生 的 热点 之 间 
没有 重合 ) ; 二 是 与 负载 无 关 的 〈 在 任何 负载 下 ， 某 些 位 置 本 身 的 热流 密度 总 是 比较 高 ) 


下 一 个 案例 呈现 出 了 高 性 能 处 理 器 芯片 达到 稳 态 过 程 中 的 温度 曲线 。 图 1.4 
是 温度 随时 间 的 变化 曲线 ， 其 数据 是 由 英特尔 至 强 融 核 处 理 器 内 部 的 温度 传感器 
采集 的 。 示 例 中 ， 因 为 系统 冷却 风扇 全 速 运转 ， 提 供 了 足够 的 冷却 能 力 ， 所 以 最 
终 稳 态 的 温度 并 不 高 。 

图 1.5 显示 了 不 同 应 用 活动 对 热 响应 的 影响 。 图 中 描述 了 同一 坎 处 理 品 在 两 
种 高 性 能 计算 领域 的 不 同 负载 下 的 温度 曲线 。 在 两 种 不 同 的 应 用 下 ， 世 片 温度 都 
到 达 了 稳 态 ， 但 是 它们 最 终 达 到 的 最 高 温度 并 不 相同 。 
通过 图 1.4 和 图 1.5 都 可 以 观察 到 热 响 应 的 瞬 态 变化 。 图 1. 6 还 进一步 展示 
了 在 长 时 间 周 期 性 工作 任务 下 温度 的 波动 。 负 载 刚 启动 时 温度 较 低 ， 随 着 一 段 时 
间 的 高 性 能 工作 ， 温 度 不 断 攀 升 。 这 个 系统 工作 的 过 程 不 断 地 重复 ， 对 应 的 温度 
曲线 上 不 断 出 现 峰 值 和 低谷 。 因 为 每 一 个 周期 的 初始 温度 (PE TES) 都 是 上 
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50 100 150 200 250 

时 间 /s 
图 1.4 ”图 中 数据 源 自 一 款 英 特 尔 公司 的 至 强 融 核 处 理 器 的 内 置 温度 传 感 融 。 忌 片 最 终 稳定 
在 68% 左右 。 本 测试 中 冷却 风扇 全 速 运 转 ， 保 证 了 最 高 温度 低 于 触发 性 能 节 流 的 临界 阔 值 
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图 1.5 负载 的 特征 影响 热 响 应 。 从 图 中 可 以 观察 到 两 种 负载 造成 的 最 终 稳 态 
温度 差距 很 明显 。 所 有 其 他 的 条 件 〈 如 处 理 器 、 散 热风 扇 ) 都 是 相同 的 ， 所 以 温度 
之 间 的 差别 可 以 归 因 于 两 种 负载 不 同 的 计算 强度 


一 个 周期 的 最 终 温度 ， 所 以 后 一 个 周期 趋 于 产生 更 高 的 峰值 温度 。 
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图 1.6 在 高 性 能 和 低 性 能 周期 性 出 现 的 负载 作用 下 ， 处 理 器 的 温度 紧 随 负载 的 
趋势 呈现 出 周期 性 高 低 变 化 
最 后 ,图 1.7 显示 了 DTM 的 影响 。 这 张 图 上 同时 记录 了 芯片 内 部 温度 传 感 
器 的 值 和 系统 采集 到 的 时 钟 频率 的 值 。 案 例 中 ， 用 于 调整 芯片 性 能 的 临界 温度 阔 
值 设 置 为 102% 。 这 个 值 在 图 上 用 一 条 水 平 的 直 实 线 表示 。 当 温度 达到 102°C HY, 
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图 1.7 处 理 器 处 于 重负 载 和 有 限 散热 能 力 的 热 响应 : 当 温度 达到 临界 值 
102€ (用 一 条 水 平 线 表示 ) 时 ， 开 始 降 频 。 系 统 最 终 将 频率 降 到 最 低 以 保证 
芯片 的 温度 降 回 到 102°C 以 下 。 当 温度 降 到 安全 温度 以 下 ， 频 率 将 再 次 上 升 
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系统 开始 降 频 。 一 开始 ， 只 是 在 较 短 的 时 间 内 降低 频率 。 但 当 系 统 察觉 到 仅 是 如 
此 无 法 将 温度 降 回 到 102%C 以 下 。 接 下 来 ， 频 率 会 被 持续 降低 ， 直 到 温度 降 到 
102% 以下。 从 图 上 看 出 降 频 时 间 为 240s 左右 。 当 温度 传感器 检测 到 温度 已 经 低 
于 临界 温度 阐 值 ， 激 进 的 降 频 结束 ， 频 率 开始 上 升 。 

我 们 可 以 得 出 如 下 结论 : 高 性 能 芯片 在 不 同 设 定 下 会 表现 出 不 同 的 热 响应 ， 
并 且 也 会 受到 不 同 内 部 〈 性 能 的 节 流 程度 、 功 耗 、 世 片 的 排 布 、 外 过 材料 的 质 
Ht) 和 外 部 〈 负 载 、 被 动 散 热 的 能 力 、 主 动 散热 等 ) 因素 的 影响 。 芯 片 内 部 温 
度 传感器 旨 在 追踪 这 些 事件 ， 并 协调 硬件 的 总 动 干预 和 软件 层面 的 长 期 策略 。 


1.2.2 芯片 传 热 路 径 


高 性 能 集成 电路 和 系统 的 散热 是 由 以 下 几 个 因素 支配 的 : 单个 元 器 件 的 比 热 
容 和 导热 系数 ， 以 及 它们 各 自 的 功率 密度 。 下 面 ， 我 们 会 回顾 不 同 的 封装 技术 
(如 平面 、2. 5D、3D) 中 集成 电路 的 散热 路 径 ， 以 及 板 级 的 散热 路 径 。 

集成 电路 有 几 条 散热 路 径 。 图 1. 8 是 一 个 典型 的 IC 芯片 配置 ， 包 括 周围 的 
材料 和 层 。 出 于 实用 的 目的 ， 认 为 芯片 唱 圆 是 芯片 中 热 耗 的 主要 来 源 。 兄 外 同一 
块 印刷 电路 板 上 的 不 同 蕊 片 和 模 组 (例如 电感 ) 会 由 于 互相 的 热 耦合 而 产生 部 
分 热量 。 然 而 ,集成 电路 内 部 的 热 示意 图 大 致 可 由 图 1. 8 中 的 元 素来 定义 。 


散热 器 


一 > 均 热 板 


E 


是 点 


图 1.8 世 片 以 及 芯片 周边 各 层级 的 示意 医 


图 1.8 中 的 配置 可 变化 。 例 如 ， 图 1. 8 中 的 唱 圆 采用 了 倒 装 芯片 互联 (处 理 
器 最 流行 的 做 法 ) 的 方法 ， 用 铜 块 连接 到 封装 基底 。 有 些 必 片 则 是 由 线 键 代 替 。 
然后 将 基板 通过 焊料 凸 块 或 是 插座 引 脚 连接 到 电路 板 。 有 些 芯 片 没有 传 热 板 ， 而 
是 直接 用 必 片 唱 圆 接触 散热 器 的 界面 材料 涂 层 。 没 有 集成 传 热 板 的 配置 常用 在 移 
动 计算 领域 的 处 理 器 上 ， 用 在 服务 器 和 高 性 能 计算 领域 的 处 理 器 通常 都 有 传 热 
板 。 散 热 需 的 结构 也 可 以 变化 。 图 1.8 中 的 散热 需 有 鱼 片 ， 而 有 的 散热 器 没有 。 
散热 器 也 可 以 包含 热管 或 是 增加 其 他 主动 冷却 结构 〈 如 液 冷 管道 ) 。 

由 于 机 过 的 几何 形状 和 分 布 的 限制 ， 一 般 不 允许 电路 板 下 方 有 空气 通过 。 此 
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外 ， 大 部 分 高 导热 的 无 机 物 材 料 会 用 于 品 圆 的 上 表面 ， 萌 向 散热 顺 那 面 ， 同 时 曲 
圆 的 下 表面 的 热 导 率 被 严重 的 限制 。 所 以 ， 在 竖 直 方向 上 热量 主要 传 向 散热 器 。 
热量 也 通过 横向 传导 ， 从 热源 向 周围 辐射 。 然 而 硅 在 横向 的 热传导 要 弱 于 在 竖 直 
方向 的 热传导 。 所 以 向 上 传导 到 散热 器 成 了 最 主要 的 散热 路 径 。 但 是 详细 的 建 模 
和 冷却 设计 方案 也 要 考虑 到 横向 散热 效应 和 芯片 上 元 器 件 的 热 耦合 。 

通常 用 来 代表 热 反 应 的 方法 是 利用 欧姆 定律 和 传 里 叶 定 律 的 类 比 ， 把 瞬时 的 
热流 等 同 于 电路 中 的 电流 [8] 。 电 流 为 电压 和 电阻 的 比值 ， 热 流 则 为 温差 和 热 阻 
的 比值 。 表 1. 3 总 结 了 两 个 领域 中 类 比 量 。 


表 1.3 集成 电路 热 状态 相关 的 量 


热 相 关 的 量 单位 电 相 关 的 量 单位 
热量 J 电荷 C 
热流 率 W E. vii A 
比热容 J/(en? - K) LA F 
JABAL K/W 电阻 Q 
温度 K 电压 V 


当前 已 有 的 关于 电路 的 分 析 工 具 和 计算 方法 都 可 以 类 比 到 热 的 传导 。 相 似 的 
工具 和 技术 已 经 被 广泛 地 应 用 到 热 分 析 和 仿真 工具 上 ， 从 有 限 元 分 析 到 简化 
RC -电流 等 效 热 模型 3。 图 1. 9 就 是 一 个 广泛 应 用 的 等 效 网 络 图 。 
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掉 的 热量 T 
图 1.9 芯片 封装 的 简化 模型 。 右 图 是 对 应 阴影 部 分 的 热 阻 子 网 络 图 。 


完整 的 模型 会 包括 几 个 子 网 络 之 间 的 连接 


如 图 1.9 所 示 ， 将 组 件 分 成 子 块 很 常见 。 在 硅 层 中 的 每 个 网 格 点 代表 单个 热 
源 。 图 中 的 电路 网 络 模 型 能 够 将 大 规模 集成 电路 中 不 同 组 件 功率 密度 的 变化 表示 
出 来 ， 例 如 同一 个 处 理 器 中 不 同 执行 单元 之 间 的 变化 或 是 在 跨 核 心 的 多 核 忆 片 中 
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某 一 单元 的 变化 。 图 中 ， 较 大 系统 的 一 个 网 格 位 置 被 高 亮 显 示 在 左边 ， 等 效 电路 
网 络 在 右边 。 主 要 的 传 热 路 径 通 过 热 阻 表示 。 热 连接 之 间 的 横向 热传导 路 径 存在 
于 同 层 的 子 块 之 间 。 占 主导 地 位 的 散热 路 径 沿 垂直 轴 从 主动 层 向 上 至 散热 器 。 各 
JZ (如 唱 圆 、 保 温 材 料 、 传 热 板 、 散 热 器 ) 表示 相应 的 热电 阻 和 电容 ,不 同 节 
点 表示 每 一 层 的 表面 温度 。 热 稳定 封装 的 目的 是 创造 一 个 在 模块 和 散热 器 之 间 的 
良好 的 热 通 路 〈 最 小 的 热 阻 ) 。 在 这 个 抽象 的 模型 中 ， 散 热 器 的 热 阻 (或 热 导 
AR) 表示 为 一 个 单一 的 数量 。 如 果 这 是 一 个 实际 的 系统 ,那么 它 的 体积 和 散热 
右 材 料 需 要 厂商 进行 优化 设计 ， 以 符合 底层 芯片 最 差 情况 下 热 输 出 的 散热 要 求 。 
它 可 以 确保 封装 在 最 坏 情况 下 的 峰值 稳 态 温度 能 够 符合 芯片 制造 商 允 许 的 最 高 温 
度 。 然 而 ， 应 该 注意 的 是 ， 对 于 有 主动 冷却 选项 的 高 性 能 系统 而 言 ， 这 个 参数 实 
际 上 是 可 变 的。 根据 系统 的 散热 需要 ， 额 外 的 外 部 冷却 机 制 (如 空气 冷却 速率 、 
冷却 液 流量 、 热 电 制 冷 器 的 输入 电流 ) 可 以 降低 散热 器 的 效 热 了 胆 。 最 终 ， 热 传 
导 路 径 终 止 在 散热 器 和 空气 之 间 的 表面 。 
1.2.2.1 垂直 集成 技术 的 散热 

其 他 新 兴 技 术 如 基于 2. 5D 内 搬 器 芯片 和 3D 芯片 堆栈 表现 出 的 热 行为 遵循 
相同 的 基本 原则 。 然 而 ,垂直 整合 引入 了 更 明显 的 散热 挑战 ， 需 要 额外 的 设计 考 
虑 ， 特 别 是 多 层 IC 堆栈 。 图 1. 10 和 图 1. 11 给 出 了 具有 代表 性 的 2.5D 和 3D th 
片 堆栈 结构 。 
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图 1.10 2.5D 芯片 示意 图 。 单 个 芯片 、 硅 转 接 板 、PCB 层 都 与 金属 展 、C4 以 及 
焊接 球 相互 连通 。 艇 和 在 转 接 板 层 的 硅 通 孔 负载 在 不 同 的 金属 层 接口 之 间 传 递 信号 
商用 领域 中 2. 5D 芯片 的 一 个 突出 例子 是 Xilinx Virtex FPGA 设备 ， 将 高 达 4 
个 FPGA 模块 附着 在 硅 中 介 层 [1 5 GES OA IL, 3D 芯片 堆栈 的 最 成 功 的 商业 示例 
是 动态 随机 存 取 内 存 (DRAM) 记忆 芯片 ， 例 如 微米 混合 存储 器 [91 。 其 他 3D 
芯片 已 经 在 侦 测 应 用 领域 有 所 发 展 ， 其 中 单 片 MEMS 是 通过 数字 IC 层 产 生 
Ay) ， 移 动 通信 系统 则 是 3D 芯片 的 另 一 个 重要 的 目标 应 用 领域 [9] 。 
竖 直方 向 多 层 唱 圆 带 来 的 直接 后 果 是 处 于 底层 的 唱 圆 无 法 接触 到 散热 器 的 表 
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面 。 这 使 得 芯片 散热 器 的 有 效 散 热 面积 

减 小 ， 内 部 的 层 只 能 通过 它们 上 面 的 层 

传导 散热 。 竖 直 整 合 芯 片 也 有 架构 上 和 

技术 上 的 变化 。 例 如 ， 超 高 速 通 信和 品 贺 

共享 同一 内 插 器 ， 因 此 设计 师 能 够 分 配 

较 少 的 处 理 咒 内 的 本 地 存储 器 ， 而 将 更 MAA 
多 的 内 存世 片 移 到 内 插 器 上 。 反 过 来 ， 

它 也 加 剧 了 处 理 器 芯片 上 的 功率 密度 ， "x 
而 处 理 需 不 具备 内 存 阵列 热 分 散 CBS 

却 ) 的 效果 。 此 外 ， 用 于 芯片 堆 琶 技术 LAM 

中 的 唱 圆 更 加 薄 ， 使 用 不 同 的 隔离 材料 ， 图 1.11 apgtr RE. MAKRA 
这 些 因素 会 导致 较 差 的 热传导 性 并 削弱 组 成 了 芯片 不 同 的 层 。TSYV 促进 了 层 


B IB 


散热 能 力 ” 。 间 通 信 。 本 例 中 的 3D 芯片 共有 三 层 ， 
主机 可 以 并 排 托 管 多 个 蕊 片 ， 每 个 ”散热 器 和 最 上 一 层 接触 ， 最 下 边 一 层 和 
芯片 仍然 可 以 访问 专用 的 散热 融 ， 所 以 PCB 连接 


上 述 问题 对 2.5D 芯片 的 影响 并 不 严重 。 
尽管 如 此 ， 将 功率 密度 不 同和 热 输 出 不 同 的 芯片 紧密 接近 仍 可 能 会 产生 散热 问 
题 ， 因 为 通常 它们 并 没有 为 这 种 紧密 排列 进行 特别 设计 。 例 如 ， 当 将 高 性 能 多 核 
处 理 器 芯片 放置 在 靠近 内 插 器 上 的 一 堆 存 储 器 芯片 的 堆 县 中 时 ， 它 可 能 会 导致 存 
储 需 堆栈 不 均匀 的 热 行为 。 面 对 处 理 器 核心 的 存储 需 堆 侧 面具 有 较 大 的 热 输出 ， 
由 于 热 耦合 可 能 会 呈现 更 高 的 温度 ， 而 面向 外 的 一 侧 则 处 于 较 低 的 温度 。 由 于 附 
近 元 件 的 发 热 导致 IC 内 的 产生 热 不 平衡 ， 这 可 能 会 引起 性 能 和 可 靠 性 参数 的 变 
化 〈 例 如 ， 漏 电流 和 随 之 而 来 的 动态 刷新 率 变 化 ， 甚 至 烧 坏 )!51 。3D 芯片 相对 
2D 和 2. 5D 面临 更 严峻 的 散热 问题 '%'9] 。 晶 圆 堆 又 成 3D 的 结构 导致 总 散热 量 
高 于 每 个 唱 圆 作为 独立 2D 结构 时 发 热量 的 总 和 。 主 要 是 原因 是 3D 堆 受 削弱 了 
它 的 静 导 热 率 ， 因 此 热量 被 堆积 在 堆 琶 的 内 部 层 中 。 自 然 地 ， 散 热 器 只 能 与 最 上 
面 的 唱 圆 直接 接触 ， 并 且 下 面 的 所 有 其 他 层 需要 通过 导热 将 热量 传递 到 它们 上 面 
的 层 。 

图 1. 12 是 内 搬 器 上 的 16 核 处 理 器 芯片 与 4 层 串 联 堆 受 组 合 的 热 仿真 结 
处 理 噩 蔚 片 总 共 耗 散 100W 热量 。DRAM 堆栈 每 层 消耗 1W。 图 1. 12 描绘 了 顶部 
的 模 截 面 视图 和 底部 最 下 面 晶 圆 的 热 分 布 图 。 从 图 1. 13 所 示 的 截面 图 上 ， 可 以 
观察 到 芯片 最 冷 的 位 置 在 靠近 处 理 带 核心 一 侧 的 最 上 层 ， 而 面向 处 理 避 最 下 面 晶 
圆 的 侧面 是 最 热 的 。 在 这 个 案例 中 ,不 同位 置 的 温差 最 大 达到 13. 2°C 。 这 表明 
三 维 堆 若 相对 于 上 层 品 圆 而 言 ， 底 部 晶 圆 是 散热 新 席 ， 此 外 ， 当 将 具有 高 热量 的 
部 件 组 合 到 芯片 上 时 ， 可 能 会 进一步 扩大 相互 预 热 。 
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图 1.12 16 核 处 理 器 和 4 层 的 DRAM 堆栈 位 于 一 个 通用 的 硅 中 介 层 。 整 个 芯片 处 
于 重 载荷 (£329 100W) 下 的 热 分 布 图 
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图 1.13 4 层 DRAM 堆栈 的 热 分 布 图 显示 出 竖 直 整合 对 底层 的 影响 。 
此 外 ， 较 热 层 对 其 相 邻 层 的 影响 也 很 显著 


垂直 集成 技术 利用 各 种 设计 优化 减少 热量 积聚 。 其 中 一 个 重要 的 优化 就 是 层 
次 的 排序 和 层次 的 功能 分 配 。 通 常 ， 最 活跃 的 高 速 数 字 逻 辑 模块 〈 例 如 处 理 器 
核心 ) 放置 在 靠近 散热 器 的 最 上 层 ， 而 具有 较 少 功率 密度 和 热 输出 〈 如 存储 器 ) 
的 层 可 以 放置 在 远离 散热 器 位 置 。 然 而 ， 对 于 3D 芯片 的 某 些 组 成 而 言 ， 包 括 广 
泛 的 功能 ， 如 数字 届 辑 、MEMS 、 光 学 器 件 。 决 定 管 芯 特 定 排序 的 可 能 是 IO 需 
求 或 机 械 的 要 求 。 此 外 ， 当 组 合 具 有 相同 功能 的 多 个 管 作 时， 需要 考虑 设计 优 
化 ， 如 旋转 和 折 和 县。 给 定 层 上 的 管 世 可 以 相对 于 先前 的 层 进 行 旋转 ， 使 得 高 功率 
密度 的 子 块 在 垂直 方向 上 不 会 完全 重合 。 

设计 优化 可 以 在 一 定 程度 上 改进 功率 密度 和 散热 问题 ， 但 它 可 能 无 法 完全 解 
决 问题 。 此 外 ， 由 于 增加 的 设计 复杂 性 ， 这 些 解 决 方案 实践 中 可 能 是 不 可 行 的 。 
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用 于 提高 从 底层 向 散热 器 热 侧 的 导热 性 的 结构 解决 方案 是 设计 热 过 孔 (TSV), 
ih TSV 在 结构 上 等 同 于 3D IC 工艺 中 广泛 使 用 的 信号 TSV， 信 和 号 TSV 用 以 实现 
高 速 和 高 带宽 跨 层 信 号 通信 。 同 样 ，2. 5D 芯片 利用 TSV 来 实现 插入 器 和 封装 衬 
底 之 间 的 高 速 互 连 。TSYV 本 质 上 是 穿 透 一 个 或 多 个 管 芯 和 硅 衬 底 的 垂直 连接 。 由 
于 TSV 填充 有 导热 材料 (通常 是 金属 的 ， 例 如 铜 和 钨 ) ， 使 得 它 在 垂直 方向 上 有 
极 好 的 传 热 路 径 。 热 TSV 被 放置 在 垂直 IC 堆 硬 中 作为 电 隔离 结构 ， 纯 粹 用 于 传 
热 的 目的 。 用 于 PCB 级 热管 理 的 类 似 解 决 方案 长 期 以 来 一 直 用 于 热 通 孔 中 。 热 
TSV 可 以 以 常规 的 方式 放置 在 IC 堆 中 ， 或 者 集中 在 高 功率 密度 的 特定 区 
Ja LOS -70] 。 一 种 常见 方法 是 将 一 定 比 例 的 芯片 面积 预先 分 配给 热 TSV， 然 后 相应 
地 放置 到 热 TSV 网 格 。 实 验 研 究 通常 有 助 于 确定 最 优 分 配 !74 。 在 学 术 研 究 中 还 
提出 了 根据 功率 密度 的 变化 和 整个 芯片 所 需 的 有 效 热 导 率 定制 放置 方法 [2 -74] 。 
1.2.2.2 板 级 及 板 级 以 上 的 散热 路 径 

在 芯片 封装 之 外 ， 存 在 导致 各 种 系统 部 件 之 间 热 耦合 的 散热 路 径 。 对 于 高 性 
能 数字 IC 而 言 ， 其 内 部 产生 热量 通常 会 主导 其 热 状 态 ，PCB 通过 热 耦 合 对 其 热 
状态 有 辅助 的 影响 。 有 多 种 将 芯片 封装 连接 到 外 部 IO 和 PCB 的 方法 来 强化 这 方 
面 的 散热 。 根 据 所 使 用 的 连接 和 材料 的 类 型 ， 存 在 从 芯片 的 背面 通过 芯片 焊 盘 向 
远离 散热 器 方向 传 热 的 路 径 ， 热 通过 引线 键 合 或 焊料 凸 块 进入 PCB。 使 用 焊料 凸 
块 的 倒 装 芯片 封装 强化 了 芯片 和 PCB 之 间 热 耦合 ， 因 此 ， 它 对 提升 高 性 能 芯片 
的 散热 有 明显 的 帮助 。 

在 板 级 ， 某 些 组 件 的 热 状 态 可 能 通过 传导 和 对 流 受 到 板 级 其 他 元 件 的 强烈 影 
响 。 一 个 突出 的 例子 是 共享 相同 双 列 直 插 式 内 存 模 块 (DIMM) 内 存世 片 之 间 的 
热 影响 。 图 1. 14 显示 了 代表 性 配置 单 板 上 的 几 个 组 件 ， 包 括 冷 却 风 扇 、 处 理 器 
芯片 和 存储 器 DIMM。 单 个 DIMM 芯片 的 热 态 将 受 多 个 因素 影响 [5] 。 芯 片 自身 
的 内 部 功率 密度 仍 是 主导 因素 。 然 而 ， 板 级 相关 部 件 的 放置 也 将 决定 它们 冷却 效 
率 ， 但 反 过 来 也 会 影响 它们 各 自 的 热 反 应 。 如 图 1. 14 所 示 ， 冷 空气 在 与 热处理 

芯片 交互 后 到 达 存 储 器 模块 。 在 这 种 情况 下 ， 气 流下 游 的 存储 器 芯片 将 处 于 劣 
势 ， 在 相同 执行 动作 下 它们 会 比 气流 上 游 的 芯片 处 于 更 恶劣 的 热 条 件 。 此 外 ， 一 
些 DIMM 配置 包含 一 个 缓冲 芯片 ， 通 常 放 置 在 一 排 DIMM 芯片 的 中 心 。 该 数字 
IC 作为 存储 器 控制 器 和 存储 器 芯片 之 间 的 缓冲 器 ， 从 而 可 以 方便 控制 和 执行 其 
他 功能 ， 例 如 纠 错 。 这 些 芯片 也 有 相当 大 的 功率 密度 ， 它 们 会 通过 热传导 影响 存 
储 器 芯片 的 热 状 态 。 一 些 内 存 供应 商 还 提供 为 所 有 内 存 和 缓冲 芯片 散热 的 一 体 化 
散热 器 。 这 有 助 于 增强 热量 的 传导 并 产生 更 大 的 接触 表面 积 ， 强 化 与 冷却 气流 进 
行 对 流 换 热 ， 同 时 也 建立 了 从 较 热 热 缓冲 芯片 到 较 冷 的 记忆 芯片 的 直接 热传导 路 
径 ， 导 致 其 温度 降低 。 总 之 ， 除 了 给 定 IC 内 的 横向 和 垂直 热 路 径 之 外 ， 由 于 与 
其 他 元 器 件 共享 散热 器 以 及 主板 上 的 物理 间隙 较 小 的 缘故 ， 其 他 更 加 活跃 的 热源 
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可 能 会 对 芯片 产生 额外 的 热 耦 合 。 图 1. 15 给 出 了 存在 上 述 热 路 径 的 情况 时 ， 放 


置 在 二 极 管 两 侧 的 电极 片 温度 变化 。 


图 1.15 内 存 上 各 个 DRAM 芯片 的 温度 分 布 〈 正 面 的 记 为 Fl ~F8, 背面 的 记 为 Bl ~ B8) 
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i Fr A Th BE Pe gs AI TAE Re PR: 产生 与 被 测 区 域 温度 相 关 
的 电压 值 、 电 流 值 或 者 脉冲 信和 号， 不 同 的 温度 对 应 不 同 的 电压 、 电 流 或 者 脉动 信 
号 ， 通 过 生成 的 电压 、 电 流 和 脉冲 信号 来 反映 被 测 区 域 的 温度 。 这 些 温度 传 感 器 
通常 由 两 部 分 组 成 ， 分 别称 为 前 端 和 后 端 。 后 端 主 要 负责 测量 ,通过 相应 的 装置 
生成 可 被 测量 的 电压 、 电 流 、 脉 冲 信 和 号。 前 端 主要 负责 转化 ， 将 后 端 生 成 的 电 
压 、 电 流 和 脉冲 信号 转化 成 数字 读 显 值 ， 它 通常 在 热管 理 模块 的 下 游 使 用 。 如 果 
将 测量 区 域 前 端 和 后 端 封装 在 同一 颗 必 片 内 ， 则 它 又 被 称 为 局 部 温度 传 感 需 
( 它 的 测量 行为 也 被 称 为 局 部 侦 测 ) 。 如 果 将 测量 区 域 传 感 器 的 前 端 和 后 端 分 开 ， 
将 后 端 被 放置 在 热点 上 或 者 热点 附件 进行 温度 测量 ， 将 前 端 被 放置 到 必 片 内 或 者 
芯片 外 进行 信号 转化 ， 多 个 后 端 可 以 共用 同一 个 前 端 ， 这 种 前 端 和 后 端 被 物理 分 
开放 置 的 温度 传感器 ， 又 被 称 为 远程 温度 传 感 顺 。 不 论 是 局 部 温度 传 感 需 还 是 远 
程 温度 传感器 ， 都 可 以 分 为 模拟 型 和 数字 型 。 利 用 植 人 到 芯片 内 的 PN 结 、 双 极 
型 晶体 管 (BJT) 、 电 阻 线路 或 者 其 他 热电 材料 作为 后 端的 传感器 ， 我 们 称 为 模 
拟 型 温度 传感器 。 相 对 地 ， 各 种 类 型 的 数字 型 温度 传感器 后 端 则 都 是 利用 
MOSFET 作 为 主要 构成 元 件 ， 如 利用 MOSFET 作为 二 极 管 结 、 反 转 延 迟 线 、 环 形 
振荡 噩 、 漏 电 电 流传 感 器 等 。 

芯片 内 置 传 感 吉 的 发 展 大 约 经 历 了 两 段 阶段 ， 早 期 的 忆 片 内 置 温度 传 感 顺 主 
要 为 模拟 型 温度 传 感 涡 ， 它 全 部 由 模拟 电路 组 成 ， 并 通过 前 端 偏 置 二 极 管 的 阻抗 
与 温度 的 依赖 关系 来 进行 温度 检测 。 内 置 到 新 一 代 忌 片 内 的 数字 型 温度 传 感 需 ， 
主要 由 各 种 基于 CMOS 管 的 延 退 /漏电 /时 间 到 温度 转化 器 构成 。 自 从 芯片 厂商 开 
始 在 他 们 的 产品 中 导入 热管 理 ， 忆 片 厂商 就 一 直 致 力 于 推动 世 片 内 置 温度 传 感 融 
的 变革 。 尽 管 单独 的 二 极 管 占据 较 少 的 硅 唱 片面 积 ， 但 是 由 于 受到 运行 范围 内 非 
线性 度 、 热 负 和 价差 异 以 及 制造 工艺 差异 的 影响 ,二极管 的 测量 精度 通常 会 更 差 。 
为 了 弥补 这 些 劣势 ， 通 常 要 引入 额外 电路 来 提高 其 检测 稳定 性 和 线性 度 。 通 过 这 
种 方式 ， 数 字 型 温度 传 感 带 在 付出 较 少 的 设计 和 测试 成 本 前 提 下 ， 也 能 获得 较 高 
的 测量 精度 ， 当 然 它 需要 花费 一 定 的 代价 ， 如 消耗 更 高 的 功率 以 及 需要 用 到 更 大 
的 硅 晶 片 。 我 们 将 在 本 童 接 下 来 的 内 容 中 ， 详 细 讨 论 各 种 类 型 的 模拟 型 和 数字 型 
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温度 传感器 ， 以 及 它们 的 设计 、 测 试 以 及 生产 制造 的 挑战 。 另 外 ， 各 种 间接 测量 
忆 片 温度 的 方法 和 标准 也 会 被 介绍 。 这 些 间 接 测量 方法 可 用 于 补充 实际 传 感 顺 的 
测量 数据 ， 同 只 采用 直接 的 芯片 内 置 传感器 放置 方式 相 比 ， 引 入 了 间接 测量 方法 
后 可 以 为 测量 系统 创造 出 一 个 精细 的 温度 图 。 

在 我 们 进行 介绍 各 种 芯片 内 置 温度 传 感 带 之 前 ， 让 我 们 首先 探讨 一 让 ， 温 度 
传感器 作为 设计 选项 的 性 能 参数 ， 以 及 在 各 种 不 同 应 用 场景 下 人 们 对 传感器 的 期 
望 值 。 


2.1 心 片 内 置 温度 传感器 的 工作 条 件 及 性 能 参数 


温度 传感器 有 很 多 性 能 参数 指标 ， 可 以 用 来 对 温度 传感器 进行 分 类 。 表 2.1 
总 结 了 在 实际 应 用 中 常用 的 主要 性 能 参数 ， 以 及 应 用 到 商业 芯片 时 这 些 参数 的 范 
围 值 ， 这 些 值 在 学 术 性 刊物 上 也 有 报道 。 同 宏观 尺度 的 温度 内 置 传 感 带 以 及 分 离 
式 温度 传 感 右 相 比 ， 纳 米 尺度 的 温度 内 置 传 感 融 更 容易 受到 不 同 的 热 应 用 条 件 和 
设计 限制 。 测 量 精度 、 线 性 度 以 及 分 辨 率 对 两 种 尺度 传感器 而 言 同 样 重要 。 同 
时 ， 温 度 内 置 传感器 通常 被 期 望 设 计 得 更 加 小 型 化 、 消 耗 更 低 功 耗 、 具 有 良好 可 
重复 测量 性 以 及 对 制造 工艺 变化 具有 良好 的 抗 扰 性 。 另 外 ， 对 于 内 置 了 温度 传 感 
器 的 芯片 而 言 ， 任 何 要求 的 校正 都 会 增加 主 心 片 的 制造 成 本 ， 而 分 离 式 的 温度 传 
感 器 则 不 用 面 对 这 样 的 问题 。 世 片 内 置 温度 传 感 顺 的 规格 参数 随 应 用 场景 不 同 而 
变化 ， 需 要 重点 指出 的 是 ， 即 使 在 同一 款 芯 片 中 ， 温 度 传感器 的 使 用 目的 也 可 能 
不 同 。 有 些 芯 片 制造 商会 接受 较 小 尺寸 但 测量 误差 较 大 的 设计 ， 而 另外 一 些 厂 商 
则 更 愿意 接受 测量 精度 尽 可 能 高 但 更 加 复杂 的 设计 。 

表 2.1 芯片 内 置 温度 传感器 定义 的 通用 规格 参数 
规格 参数 单位 范围 


-120 ~120% (航空 ) 
温度 范围 "C -70 ~125C (军工 、 商 业 ) 
20 ~125% (处 理 器 和 内 存 ) 


+10% (早期 处 理 器 的 温度 传感器 ) 

准确 度 C +1% (当前 处 理 器 的 温度 传感器 ) 

低 至 +0.15%C (科研 设计 1!]) 

8 ~24bit 模拟 数字 转化 器 (ADC) 

0.09 ~0.28% (科研 设计 ) 

2 ~15M 样品 数 /s 

50 样品 数 /s (90nm 商业 处 理 器 [21 ) 

面积 2 0. 006mm? (22nm 处 理 器 芯片 531 ) 

d. is 0.013 ~0. 6mm? (22 ~350nm 范围 内 处 理 器 节点 ) 
功 耗 W 3nW ~2. 88mW 


Aer v 


采样 速率 样品 数 /s 
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目前 芯片 内 置 温 度 监 控 倾 向 于 设计 低 成 本 的 温度 传感器 ， 将 其 能 入 到 芯片 内 
部 以 获取 精细 温度 网 络 ， 并 且 尽 可 能 地 覆盖 温度 最 高 的 热点 。 而 且 ， 对 于 动态 热 
管理 (DTM) 这 种 新 应 用 ， 温 度 监控 可 能 要 求 更 高 的 测量 精度 ， 并 且 需 要 尽 可 
能 监测 到 最 小 温度 的 波动 ; 同时 这 些 技 术 反 过 来 也 会 被 用 于 鉴定 /检测 具体 芯片 
的 性 能 ， 或 者 将 温度 同 工 艺 差异 、 生 产 其 他 方面 关联 起 来 。 在 接 下 来 的 草 节 中 ， 
我 们 将 会 以 商业 级 和 科研 级 最 先进 传感器 导入 为 例 ， 分 别 讨论 相关 温度 传感器 的 
参数 ， 以 及 它们 如 何 同 芯片 实用 性 相关 联 。 

温度 传感器 的 温度 范围 是 指 能 维持 它 标 称 的 线性 度 和 准确 度 的 最 大 应 用 温度 
范围 。 对 于 一 个 给 定 的 温度 传感器 而 言 ， 它 的 应 用 温度 范围 和 温度 传感器 的 应 用 
场景 密切 相关 。 在 商业 领域 ， 采 用 了 温度 监控 系统 的 高 性 能 芯片 工作 范围 ， 通 常 
在 20 ~125% 之 间 。 在 实际 使 用 时 ， 这 些 芯片 的 大 部 分 峰值 温度 都 不 会 超过 
90% ， 偶 尔 会 高 于 该 峰值 温度 (如 最 先进 的 服务 器 处 理 器 在 害 频 加 速 的 阶段 )。 
垂直 集成 的 3D IC 芯片 峰值 温度 已 经 被 报道 会 超过 90% ， 同 2D IC 芯片 相 比 ， 它 
的 热点 区 域 最 恶劣 运行 温度 更 加 容易 达到 或 者 超过 90% 。 对 于 其 他 的 高 负荷 运 
行 条 件 ， 如 军工 和 航空 、 航 天 ， 则 需要 更 加 宽 的 -50 ~150% 的 温度 范围 。 因 此 
各 种 高 性 能 的 处 理 器 和 DRAM 芯片 也 会 被 厂商 筛选 出 来 ， 它 们 可 靠 的 运行 温度 
可 以 达到 125°C 。 

在 给 定 的 温度 范围 内 ， 温 度 传感器 有 一 些 重要 的 规格 参数 ， 包 括 准确 度 、 分 
辩 率 、 线 性 度 、 采 样 速率 、 尺 寸 和 功 耗 。 当 我 们 讨论 各 种 不 同类 型 的 温度 传感器 
的 参数 时 ， 应 当 将 这 些 用 在 商业 领域 的 产品 同 用 于 科研 领域 的 产品 区 分 开 来 讨 
论 。 对 于 那些 被 用 在 最 先进 商业 芯片 内 的 温度 传感器 ， 它 们 的 测量 重复 性 以 及 对 
工艺 变化 的 抗 扰 性 已 经 被 批量 验证 通过 。 而 对 于 那些 用 在 科研 领域 的 温度 传感器 
的 设计 ， 它 们 的 测量 可 重复 性 和 抗 扰 性 还 未 经 过 批量 验证 ， 目 前 还 只 停留 在 有 限 
数量 的 样品 验证 阶段 〈 样 品 数量 为 几 个 到 几 十 个 ) ， 甚 至 有 些 还 只 是 刚刚 通过 仿 
真 验证 。 基 于 以 上 原因 ， 我 们 在 评估 温度 传感器 标 称 的 最 佳 参数 时 ， 需 要 考虑 到 
这 一 点 。 例 如 ， 目 前 商业 领域 采用 的 温度 传感器 ， 它 们 的 目标 分 辩 率 大 概 为 
0.1'C, ， 目 标 测 量 准确 度 低 于 2% ， 当 然 应 用 在 不 同 产品 上 目标 数值 可 能 会 略 大 
于 或 者 低 于 上 述 数值 。 

准确 度 / 不 准确 度 : 温度 传感器 的 准确 度 / 不 准确 度 被 广泛 地 定义 为 : 在 定义 
的 运行 温度 范围 内 以 及 最 差 测 量 情 况 下 ， 测 试 的 数值 与 实际 数值 之 间 的 差异 。 另 
外 一 个 相关 的 传感器 参数 为 精度 ， 它 是 指 温 度 传感器 能 准确 地 、 一 致 地 读 取 到 的 
温度 最 小 波动 值 。 在 关注 芯片 内 置 温度 传 感 费 的 文献 中 ， 高 准确 度 和 高 精度 通常 
能 够 互 换 使 用 。 在 本 书 中 ， 传 感 器 提 到 的 准确 度 参 数 ， 主 要 指 区 分 温度 增长 变化 
的 准确 范围 。 

热 测 量 准 确 度 的 概念 被 用 于 表示 芯片 内 置 热 监控 系统 测量 到 的 温度 数值 与 具 
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体 物理 位 置 处 实际 温度 的 差 值 。 在 实际 使 用 中 ， 它 经 常会 进一步 同 必 片上 出 现 的 
峰值 温度 相关 联 ， 因 为 它 是 芯片 实现 精确 测量 最 相关 的 参数 之 一 。 因 此 ， 测 量 准 
确 度 可 以 被 理解 为 热 监控 系统 所 能 侦 测 到 精确 程度 ， 以 及 报道 的 必 片 物理 峰值 温 
度 真 实 程度 。 

到 目前 为 止 ， 根据 之 前 的 定义 ,单个 传 感 絮 的 精度 /准确 度 已 被 阐述 ， 用 于 
建立 温度 依赖 性 的 基本 构成 元 件 是 其 主要 影响 因素 。 如 基于 二 极 管 / 双 极 型 晶体 
E (BJT) 的 模拟 温度 传感器 会 受到 设备 的 非 线 性 度 以 及 波动 影响 ， 它 们 同时 也 
会 影响 正比 于 温度 的 结 / 基 极 - 射 极 输出 电压 数值 。 输 出 电压 值 是 模拟 型 传感器 
的 测量 基础 ， 通 过 它 来 表征 测量 温度 数值 。 相 似 地 ， 采 用 了 MOSFET 晶体 管 构 
成 的 传 感 带 基本 都 会 产生 一 个 依赖 于 温度 的 信号 ， 表 现 为 MOSFET 的 栅 源 电压 。 
设备 参数 中 本 身 的 固有 不 准确 度 ， 会 造成 测量 数值 与 实际 电压 输出 值 之 间 偏 差 。 
男 外 ,任何 的 输出 电压 、 电 流 的 传输 过 程 也 会 导致 偏差 。 传 输 过 程 的 偏差 受 多 种 
因素 影响 ， 如 挫 杂 波动 、 氧 化 层 厚 度 变化 、 国 值 电压 变化 ， 这 些 都 容易 导致 
MOSFET 的 测量 出 现 不 准确 。 另 一 方面 ， 模 拟 型 结构 更 加 容易 受到 噪声 以 及 设备 
啊 应 的 热 依赖 影响 。 而 且 ， 传 感 器 的 前 端 结构 特别 是 模拟 数字 转化 器 (ADC) 
是 另 一 个 导致 测量 不 准确 的 因素 。 不 论 是 后 端 结构 (基于 双 极 型 晶体 管 BIT 或 
者 基于 MOSFET) 还 是 前 端 模拟 数字 转化 结构 ， 都 会 用 到 一 个 或 多 个 参考 电压 或 
(Al) 参考 电流 。 对 于 一 个 给 定 的 传感器 设计 而 言 ， 校 正 电 路 能 提高 测量 不 准确 
度 ， 其 工作 温度 范围 也 可 以 被 调整 去 反映 在 运行 范围 内 测量 一 臻 区域。 尽管 如 
此 ， 任 何 实际 的 温度 传感器 ， 当 作为 攻 片 内 置 传 感 融 时， 为 了 覆盖 如 此 宽 的 工作 
温度 范围 都 存在 一 定 的 测量 不 准确 定 度 。 

A HE. 分 辨 率 是 指 温度 传感器 能 可 靠 地 区 分 和 侦 测 出 的 最 小 的 变化 数值 。 
温度 传感器 的 分 辩 率 很 大 程度 上 将 受 物理 参数 (如 电压 、 电 流 、 电 子 脉冲 、 频 
率 ) 转化 成 数字 读 显 值 的 转化 方法 影响 。 前 端 器 件 ， 如 模拟 数字 转化 的 ADC, 
用 于 执行 转化 的 计数 器 直接 决定 了 能 获得 什么 的 测量 精度 。 男 一 方面 ， 随 着 分 辨 
率 的 增加 ， 转 化 单元 的 设计 复杂 性 也 会 增加 ， 同 时 会 要 求 更 大 的 相关 面积 以 及 消 
耗 更 多 的 功 耗 。 因 此 ， 在 实际 使 用 过 程 中 ， 人 们 偏向 于 设计 能 恰好 满足 要 求 的 测 
量 分 辨 紊 ， 同 时 保证 数字 转化 复杂 度 较 低 。 如 已 知 的 期 望 温度 范围 (R) 和 期 望 
DBR (r), ， 则 需要 的 数字 转化 步 数 可 以 按照 下 式 计算 得 出 : 


总 的 模拟 数字 转化 步 数 - & (2.1) 


相应 地 ， 传 感 咒 前 端 数字 输出 的 比特 位 数 〈 即 模拟 数字 转化 ADC 比特 宽 
度 ) ， 按 照 下 式 计算 : 


r 


ADC 比特 宽度 = log ) (2,2) 
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例如 ， 对 于 一 个 期 望 温度 范围 为 100% 的 传感器 ， 如 果 需 要 它 提供 0. 1°C 的 
DRK, WENERA ADC 比特 宽度 为 10bit。 

线性 度 : 线性 度 被 定义 为 传感器 能 依据 它 响应 函数 工作 的 能 力 。 响 应 函数 是 
间 基 于 温度 的 线性 函数 。 所 有 传感器 都 期 望 能 以 这 样 一 种 或 另外 一 种 方式 来 展现 
这 种 线性 转化 函数 ， 即 在 允许 的 工作 温度 范围 内 ， 对 线性 响应 曲线 的 最 大 偏离 
度 ， 以 传感器 的 线性 度 参 数 进行 表征 。 不 同类 型 的 传感器 通过 不 同 的 工作 方式 建 
立 这 种 线性 函数 ， 如 基于 双 极 型 晶体 管 (BJT) 的 传感器 后 端 利 用 了 晶体 管 PN 
结 前 向 偏 置 电压 和 温度 之 间 的 近似 线性 关系 ; 基于 MOSFET 的 传感器 后 端 旨 在 
建立 网 络 中 调谐 晶体 管 的 阔 值 电压 同 栅 源 电压 之 间 的 线 线 关系 ， 而 阔 值 电压 又 表 
现 出 对 温度 的 依赖 性 。 其 他 类 型 的 传感器 ， 如 热电 偶 ， 则 利用 金属 材料 本 身 的 电 
荷载 流 子 迁 移 同 温度 之 间 的 线性 关系 。 此 外 ， 传 感 需 前 端 结构 (如 ADC) 会 呈 
现 出 一 定 的 非 线性 度 ， 它 们 反 过 来 也 会 影响 所 有 传感器 的 转化 函数 ， 大 部 分 实际 
的 温度 内 置 传感器 设计 都 是 期 望 将 线性 度 偏差 维持 在 1% 以 内 。 

采样 速率 : 采样 速率 被 定义 为 传感器 在 每 个 单位 时 间 内 能 采集 到 最 多 的 温度 
样本 数 ， 或 者 说 完成 一 次 温度 采集 所 需要 的 最 小 时 间 ， 这 个 定义 包括 了 前 端 和 后 
端 元 件 采样 /工作 动作 。 温 度 传 感 器 的 采样 速率 依赖 于 实际 热 监 测 系统 的 应 用 需 
要 ， 同 时 系统 中 温度 监测 的 时 间 分 辩 率 间隔 需求 也 依赖 于 相关 的 热 时 间 常 数 ， 芯 
片 温 度 的 上 升 和 下 降 速 度 直 接 影 响 温 度 的 测量 频率 。 芯 片 的 热 时 间 常 数 ， 被 定义 
为 芯片 有 效 热 阻 和 它 热 容 之 间 的 函数 参数 ， 它 是 用 来 衡量 将 一 定 的 功率 密度 加 载 
到 芯片 时 ， 系 统 从 初始 温度 达到 稳定 温度 所 需要 的 时 间 长 短 。 不 同 材 料 、 不 同 封 
装 方式 、 不 同 散 热 方式 构成 的 芯片 会 产生 不 同 的 时 间 常 数 。 通 常情 况 下 ， 高 新 能 
处 理 器 的 热 时 间 常 数 一 般 为 几 十 毫秒 的 量 级 [和 中。 芯片 内 置 温度 传 感 右 被 期 望 能 
以 一 种 可 接受 的 速率 去 测量 温度 ， 同 时 要 能 捕捉 到 芯片 精细 温度 响应 图 。 芯 片 在 
最 高 负荷 运行 或 者 功率 突然 提升 时 ，lms 内 它 的 温度 变化 可 以 会 有 几 摄 氏 
FESS] 。 另 一 方面 ， 传 感 器 采样 速率 越 快 ， 消 耗 的 功率 也 会 越 大 ; 同样 地 ， 热 管 
理 系统 与 温度 传感器 的 通信 也 会 相应 地 变 得 更 加 频繁 。 

面积 : 芯片 内 置 温 度 传感器 的 面积 会 影响 导入 传感器 的 设计 开销 ， 同 样 也 会 
影响 芯片 温度 测量 覆盖 范围 ， 最 终 就 会 影响 芯片 级 热 监控 的 精度 。 当 传感器 的 面 
积 比 较 小 时 ， 能 被 大 量 地 植 人 到 一 颗 芯 片 内 ， 在 每 一 个 采样 周期 内 就 能 提供 较 详 
尽 的 温度 图 ， 而 在 整个 芯片 面积 上 获取 的 温度 测量 覆盖 范围 又 被 称 为 传感器 的 空 
间 分 辨 率 。 每 个 独立 的 传感器 都 能 准确 追踪 其 测量 覆盖 范围 内 热 事 件 ， 测 量 覆 盖 
范围 以 外 的 热 事件 也 同样 能 被 记录 ， 但 是 测量 偏差 会 非常 大 ， 而 且 其 测试 结果 可 
能 会 变 成 完全 不 可 靠 且 不 具有 代表 性 。 目 前 应 用 在 商业 芯片 领域 的 传感器 导 人 方 
式 不 同 ， 其 占据 的 面积 也 会 不 同 。 如 果 仅 仅 将 温度 传感器 的 模拟 型 后 端 内 置 到 芯 
片 内 部 ， 而 将 数字 转化 前 端 放置 在 芯片 外 部 ， 这 样 的 传感器 通常 占用 芯片 的 面积 


=i 


=© = 集成 电路 热管 理 ; 片上 和 系统 级 的 监测 及 冷却 


是 最 小 的 。 需 要 注意 的 是 ， 这 种 导入 方式 同样 会 付出 一 定 的 代价 ， 它 需要 在 模拟 
输出 信号 和 数字 转化 器 之 间 进 行 长 距离 传输 ， 因 此 需要 额外 的 引 脚 来 进行 传输 操 
作 。 对 于 将 前 端 和 后 端 集成 在 同一 颗 世 片 内 的 数字 型 传感器 而 言 ， 它 们 通常 会 
用 较 大 的 面积 ， 这 对 整个 芯片 的 硅 晶片 面积 是 个 考验 。 随 着 新 一 代 忆 片 中 内 置 的 
传 感 需 数量 越 来 越 多 ， 全 部 传感器 的 总 面积 变 得 越 来 越 不 可 忽视 。 据 报道 在 m- 
tel Nehalem 系列 处 理 融 中 ， 传 感 需 占据 的 面积 超过 了 芯片 面积 1% [6] ， 而 内 置 在 
已 经 批量 生产 的 22nm 高 端 商业 芯片 中 传感器 的 面积 大 约 只 有 0. 006m? |! 

功 耗 : 随 着 在 新 一 代 处 理 咒 中 集成 传 感 需 数量 的 增加 ， 温 度 传 感 锅 的 功 耗 也 
正在 变 得 越 来 越 重 要 。 现 代 高 性 能 处 理 器 世 片 采用 了 大 量 内 置 的 监控 装置 ， 包 括 
温度 传感器 、 延 迟 传 感 咒 、 电 流传 感 需 ， 这 些 装 置 主要 用 来 做 先进 的 电源 管理 以 
及 监控 制造 阶段 对 工艺 变化 的 适应 性 。 每 个 这 种 附带 特征 都 会 引入 额外 的 开销 ， 
总 的 额外 开销 数量 会 变 得 非常 显著 。 因 此 ， 为 了 实现 大 规模 以 及 最 大 的 测量 覆盖 
范围 ， 设 计 者 应 该 细致 地 优化 传感器 的 面积 以 及 功 耗 。 另 外 ,不 仅仅 只 有 高 功 
耗 、 高 性 能 处 理 器 核 内 才 集成 传感器 ; 一 些 新 出 现 的 产品 (如 低 功 耗 的 移动 世 
K) 也 需要 集成 温度 监控 功能 ， 因 为 小 尺寸 高 封装 密度 的 电子 产品 功 耗 变 得 越 
来 越 严 峻 ， 如 智能 手机 、 笔 记 本 电脑 。 在 这 些 产品 中 ， 将 所 有 忌 片 内 置疑 件 的 功 
耗 设计 到 极 低 值 变 得 非常 至 关 重 要 。 

除了 上 面 描述 的 主要 参数 外 ， 同 其 他 类 型 世 片 内 置 器 件 一 样 ， 传 感 器 的 其 他 
设计 参数 如 自发 热 、 噪 声 免 疫 力 、 对 工艺 变化 的 抗 扰 性 也 是 非常 重要 的 。 在 后 面 
几 章 介绍 传 感 吉 的 设计 和 制造 挑 成 时 ， 我 们 会 阐述 这 些 问 题 中 一 部 分 。 当 然 ， 我 
们 需要 注意 的 是 ， 上 面 一 些 性 能 参数 是 相互 关联 的 。 高 精度 和 高 分 辩 率 通常 会 导致 
大 面积 和 高 功 耗 ， 相 似 地 ， 较 快 的 采样 速率 也 会 导致 较 高 功 耗 。 最 终 ， 温 度 监 控 系 
统 的 总 成 本 也 取决 于 系统 中 布置 的 传感器 数量 以 及 他 们 同 整 个 世 片 范围 内 热 监控 系统 
的 交互 方式 ， 传 感 器 同 更 大 规模 监控 系统 之 间 的 交互 方式 将 会 在 2.6 节 单 独 介绍 。 


2.2 ”模拟 型 温度 传感器 


模拟 型 芯片 内 置 温度 传感器 通过 被 测 / 输 出 信号 的 变化 来 表征 温度 ， 如 电压 、 
电流 以 及 延迟 。 这 些 输出 信和 号 最 终 会 通过 ADC 转化 成 一 个 绝对 的 数字 读 显 值 。 
设计 模拟 型 温度 传感器 的 后 端 结 构 !" 1 的 方法 有 很 多 种 ， 我 们 将 在 接 下 来 的 章节 
里 介绍 设计 传 感 右 前 端 和 后 端的 通用 方法 。 
2.2.1 基于 热 二 极 管 的 传感器 

在 实际 应 用 中 ， 导 入 忌 片 内 置 温度 传 感 右 的 通用 方法 是 利用 币 隙 电路 原 
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BLS] ， 而 内 置 传感器 运行 的 基本 原理 则 是 利用 二 极 管 电阻 随 温 度 变化 特性 !?1 。 
依据 上 述 特性 ， 当 用 一 个 固定 电流 源 来 偏 置 二 极 管 的 引 脚 时 ， 二 极 管 引 脚 电 压 测 
量 值 与 温度 之 间 产 生 直接 对 应 关系 ， 通 过 测量 电压 可 以 推导 出 对 应 的 温度 数值 。 
可 以 通过 PN 结 或 者 CMOS 工艺 中 寄生 PNP 晶体 管 ， 在 芯片 上 制造 这 些 测量 
装置 。 

其 基本 原理 如 下 : 首先 在 二 极 管 强制 通过 一 个 固定 的 偏 置 电流 IS, Bei 
过 另 一 固定 的 偏 置 电流 fs，。， 导 致 二 极 管 的 前 向 偏 置 电压 产生 变化 ， 变 化 值 为 
AV,。 二 极 管 绝对 结 温 与 站 、1p; 、A 作 直接 对 应 的 函数 关系 通过 下 式 表达 : 


(2.3) 


式 中 , n 是 二 极 管 的 理想 因子 ; 是 玻 尔 兹 曼 常数 ; g 是 单个 电子 的 电荷 数 。 在 
大 多 数 传感器 的 设计 中 ， 模 拟 型 传感器 的 核心 构造 部 件 是 一 对 晶体 管 。 在 通过 固 
定 偏 置 电流 时 ， 品 体 管 的 基 极 — 射 极 电压 Vss 同 设备 所 经 历 的 温度 直接 相关 。 当 
通过 不 同 的 偏 置 电流 与 i 、1ss 时 ， 二 极 管 的 基 极 - 射 极 电压 差 值 被 分 别 从 各 上 自 
的 差分 电路 中 提取 出 来 ， 生 成 一 个 依赖 于 温度 的 输出 电压 差 值 AVpp 。AVss 又 被 
称 为 正比 于 绝对 温度 的 电压 Vprar。 最 终 ， 将 放大 后 的 差分 电压 TarAr 和 另外 一 个 
依赖 于 温度 的 二 极 管 电压 混 合 ， 产 生 一 个 新 的 同 温 度 无 关 的 参考 电压 数值 Veero 
图 2. 1 描述 一 个 利用 了 带 除 电路 和 热 二 极 管 的 模拟 型 传感器 框图 ， 热 二 极 管 是 由 
双 极 结 型 晶体 管 构成 的 2 。 需 要 注意 的 是 ， 基 于 带 隙 电路 的 模拟 型 传感器 通常 都 
含有 上 述 的 主要 构成 部 件 ， 但 是 它们 具体 的 应 用 方式 却 有 所 差别 。 因 此 ， 主 要 构 
成 部 件 同 导 入 的 独立 部 件 电 路 之 间 的 通信 方式 ， 通 常会 按照 一 种 通用 方式 进行 。 
ict 
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”此 处 意 为 将 双 极 结 型 晶体 管 接 成 二 极 管 使 用 ， 这 在 集成 电路 中 很 普遍 。 一 一 译 者 注 


集成 电路 热管 理 : 片上 和 系统 级 的 监测 及 冷却 


很 多 应 用 在 不 同 配置 下 的 传感器 都 基于 该 原理 进行 设计 1.9-!4， 其 中 一 
种 基于 晶体 管 温度 传感器 的 实现 方式 ， 被 用 到 英特尔 公司 很 多 代 90 ~ 32nm 处 理 
器 芯片 的 设计 中 ， 它 产生 的 与 温度 无 关 的 参考 电压 Vppy 会 被 作为 第 二 输出 参数 
供给 前 端 器 件 。 参 考 电压 Vps 通 过 引入 第 三 个 电流 分 支 生成 ， 第 三 个 电流 分 支 
电路 由 一 个 二 极 管 和 一 个 电阻 串联 组 成 ， 第 三 个 分 支 电 路 通过 一 个 数字 控制 的 电 
流 源 进行 偏 置 (电流 型 数 - 模 转 化 器 DAC) 。A 故 呈 现 出 正 的 温度 系数 ， 而 通过 
前 向 偏 置 二 极 管 获得 的 Vass 则 表现 为 一 个 负 的 温度 系数 ， 这 两 个 电压 会 被 输入 
到 后 端的 比较 器 内 。 传 感 涡 进行 温度 测量 时 ， 会 不 断 扫描 Vase, ELI Vreer E 
A 刀 相 匹配 。 换 句 话 而 说 ， 当 扫描 到 AV; 大 于 Vipsy 时 ， 扫描 就 会 停止 。 扫 描 参 数 
的 相应 数字 式 编码 过 程 ， 即 温度 的 数字 温度 测量 过 程 。 

另外 一 种 利用 了 二 极 管 结构 的 传感器 设计 方法 ， 被 用 在 PowerPC PY"?! 。 
传感器 利用 堆 释 在 同一 衬 底 上 P-N -P 结 生成 两 个 二 极 管 ， 从 而 产生 一 种 差分 偏 
置 电 压 ， 传 感 器 输出 的 电压 数值 是 二 极 管 的 几何 尺寸 以 及 温度 的 机 数 。 传 感 需 的 
偏 置 状 态 同 电流 镜 状态 一 起 作用 ， 产 生 两 个 依赖 于 温度 的 输出 电流 。 生 成 的 两 个 
输出 电流 会 通过 一 个 差 模 放大 器 来 进行 比较 ， 并 最 终 通过 ADC 进行 处 理 。 还 有 
一 种 基于 带 隙 电路 传感器 设计 ， 被 用 于 IBM Power7 芯片 内 ， 它 也 会 生成 一 个 电 
压 输 出 数值 LIN 

用 于 科研 学 术 领 域 的 传感器 的 设计 采用 了 相似 原理 ， 通 过 一 对 晶体 管 产生 
Jiol ， 其 中 一 路 晶体 管 的 输出 Vy 与 经 过 放大 后 的 AVIS, PES 
隙 参考 电压 。 上 述 两 种 方法 的 主要 权衡 点 为 一 方面 从 Vs 生成 的 AVrps， 使 得 
生成 的 Vngs 非 常 容易 受到 工艺 变化 影响 ， 另 一 方面 ， 生 成 的 独立 电压 Veer Th BE 
额外 的 电路 。 其 他 类 型 传感器 的 设计 则 利用 主动 材料 来 构建 前 向 偏 置 PN RPL 

利用 CMOS 芯片 中 寄生 晶体 管 的 设计 一 个 主要 缺点 是 ， 它 不 能 很 好 地 与 
CMOS 的 剩余 逻辑 部 分 一 起 匹配 升级 。 当 新 的 处 理 器 节点 上 CMOS 输入 降低 时 ， 
传感器 的 前 向 偏 置 电压 不 能 以 同样 的 幅度 降低 。 解 决 该 问题 的 一 种 方案 为 ， 采 用 
Schottky 金属 半导体 二 极 管 来 代替 晶体 管 :20] 。 


2.2.2 电阻 型 传感器 


利用 导体 阻抗 随 温度 变化 的 特性 进行 温度 测量 ， 是 众所周知 的 应 用 。 热 敏 电 
阻 正 是 根据 这 一 原理 而 设计 的 ， 并 作为 独立 的 宏观 太 度 器 件 使 用 。 对 于 芯片 内 置 
的 应 用 ， 热 敏 电阻 也 可 以 在 纳米 尺度 上 被 制造 。 例 如 ，IBM Power6 一 处 理 器 就 是 
引入 热 敏 电阻 作为 芯片 内 置 传感器 的 商业 应 用 之 一 52 。 其 采用 了 热 敏 电阻 来 代 
蔡 基 于 热 二 极 管 传 感 器 。 当 在 其 引 脚 上 施加 一 个 固定 电压 并 产生 一 定 的 电流 时 ， 
热 敏 电阻 就 能 开始 读 取 温度 。 在 已 知 温度 下 测量 热 敏 电阻 的 阻抗 值 ， 归 纳 总 结 出 
电阻 和 温度 的 关系 ， 并 利用 归纳 总 结 的 关系 对 传感器 的 读数 进行 校正 。 传 感 咒 的 
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电流 输出 值 会 被 输送 到 位 于 芯片 外 部 的 ADC， 并 最 终 转 化 成 数字 读 显 值 。 

在 科研 领域 ， 其 他 类 型 的 电阻 型 传感器 也 会 被 设计 使 用 522] 。 如 利用 延迟 线 
构成 的 热线 电阻 型 传感器 ， 它 是 由 很 多 段 低 位 金属 层 的 电阻 线 (MI, M2, M3) 
和 一 个 时 间 - 数字 转化 器 单元 构成 。 传 感 器 测量 脉冲 信号 通过 电阻 线 时 间 ， 再 通 
过 前 端 转 化 器 将 传播 时 间 转 化 成 数字 温度 读 显 值 。 金 属 层 的 热 边 界 条 件 是 与 测量 
区 域 衬 底 的 温度 紧密 耦合 的 。 因 此 ， 当 金属 层 本 身 巳 有 电阻 线 时 ， 此 类 型 传感器 
寺 别 适合 用 于 测量 金属 层 本 身 的 温度 。 而 另 一 种 基于 此 基线 架构 的 变更 设计 方 
法 ， 则 是 创造 一 个 双 延 迟 线 ， 低 位 金属 被 用 作 第 一 延迟 线 ， 而 高 位 金属 被 用 作 第 
二 延迟 线 。 

2.2.3 热电 偶 和 热电 堆 


当 导 体内 存在 温度 梯度 时 ， 接 触 点 之 间 的 温差 会 引起 电场 变化 ， 并 表现 为 在 
端点 之 间 产 生 电 位 差 ， 此 现象 即 为 塞 贝 克 效 应 。 每 个 单位 温度 差 值 产生 的 电压 值 
大 小 (VAK) 是 导体 本 身 的 固有 属性 ， 又 被 称 为 塞 贝 克 系 数 。 当 导体 上 有 温差 
时 ， 会 引起 带电 荷载 流 子 发 生 迁 移 运动 ， 直 到 相应 的 电场 产生 一 个 足够 的 力 来 抵 
消 该 迁移 运动 。 对 于 N 型 和 了 型 半导体 而 言 ， 塞 贝克 效应 分 别 受 到 获取 的 能 量 
以 及 电子 和 空 穴 的 运动 速度 支配 ,会 导致 大 量 带 电 载 流 子 持续 的 问 低 温 侧 迁 移 。 
因此 ， 所 有 N 型 半导体 都 有 一 个 负 的 塞 贝 克 系 数 ， 而 所 有 了 型 半导体 则 有 一 个 
正 的 塞 贝 克 系 数 。 对 于 金属 而 言 ， 当 产生 塞 贝克 效应 时 ， 其 他 一 些 参 数 也 开始 起 
作用 ， 并 决定 载 流 子 的 净 流 量 大 小 ， 如 载 流 子 平均 自由 程 散射 时 间 和 能 量 之 间 的 
相互 关系 [23] 。 受 到 这 些 因素 影响 ， 载 流 子 的 净 流 动 方向 要 么 朝 高 温 侧 进行 ， 要 
么 朝 低 温 侧 进 行 。 因 此 ， 当 一 些 金属 表现 出 负 的 塞 贝 克 系 数 时 ， 而 另 一 些 导体 则 
表现 出 正 的 塞 贝 克 系 数 。 表 2. 2 列 出 了 一 些 代 表 性 金属 的 体积 塞 贝克 系数 。 

表 2.2 27"C 环 温 下 代表 性 金属 /合金 的 绝对 体积 塞 贝克 系数 
( 表 中 列 出 的 大 部 分 金属 都 是 亲 CMOS 工艺 的 ) 


金属 27°C Wik FE UL GER BY ( pV/K) 
铜 +1.9 
4H -1.5 
p -10 
铬 +14 
康 铜 -30 
E» +2 
ih -65 
钨 +4 
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当 同 类 型 的 测量 线 接 到 电压 表 进行 测量 时 ， 单 个 导体 上 因 塞 贝克 效应 产生 的 
电压 差 是 无 法 被 测量 的 。 因 为 ， 同 类 型 测量 线 上 有 相似 的 温度 梯度 ， 它 们 之 间 会 
相互 抵消 ， 从 而 无 法 产生 电压 差 。 因 此 ， 如 图 2.2 所 示 ， 为 了 测量 两 种 导体 间 的 
塞 贝克 电压 相对 差 值 ， 需 要 构建 一 个 非 相似 导体 组 。 它 在 引 脚 上 产生 一 个 正比 于 
结 温差 值 TH - Tc 的 电压 ， 生 成 的 电压 值 与 管 脚 的 温度 T, 无 关 。 


AN (2.4) 
金属 A 
| 
= AT, 
$ 人 金属 B | _ E 


Te 
图 2.2” 双 金属 热电 偶 的 原理 图 ，AVic 测 量 TAI Te ZEAE, 
根据 式 (2.4) 可 知 它 与 引 脚 的 温度 以 及 每 根 导线 的 路 径 无 关 

X (2.4) 中 的 Arac 表 示 引 脚 之 间 的 塞 贝 克 电 压 ，a A FED EARL, Ty 和 
元 分 别 为 热 端 结 点 温度 和 冷 端 结 点 的 温度 。 因 此 ， 热 电 偶 只 能 测量 相对 温度 数 
值 ; 为 了 能 作为 PTAT 设备 使 用 ， 并 测 到 绝对 温度 ， 还 需要 引入 一 个 额外 的 参考 
测量 电路 。 

长 期 以 来 ， 热 电 偶 都 被 作为 宏观 尺度 的 温度 传感器 使 用 站 -2] 。 而 在 集成 电 
路 中 , 将 它们 集成 到 芯片 内 部 作为 内 置 传感器 使 用 的 概念 ， 最 近 才 开始 出 
3405-35: 。 其 中 一 种 早期 应 用 在 封装 层级 上 进行 芯片 内 置 级 温度 测量 的 方法 ， 是 


利用 一 对 铜 - 康 铜 组 成 的 宏观 尺寸 薄 放置 在 热 态 功能 单元 上 
膜 双 金属 热电 偶 组 30] 。 另 外 一 种 早 oct 


期 开发 的 、 能 与 CMOS 相 容 的 芯片 内 
置 温 度 传感器 设计 ， 则 利用 金属 [P + 
扩散 区 或 者 金属 [多晶硅 构成 热电 
偶 !2] 。 光 刻 的 薄膜 双 金 属 热电 偶 传 
感 器 依据 其 制造 和 特征 表现 ， 最 近 也 
被 提出 作为 芯片 内 置 传感器 使 用 ， 并 
开始 进行 概念 设计 [34,36] 。 此 类 型 传 
感 器 是 由 一 对 铬 -ER (Cr-Ni) 组 
成 。 由 于 CMOS 对 兼容 金属 具有 选择 
性 的 特性 ， 它 能 直接 被 集成 到 一 个 IC 
的 金属 层 内 作为 内 置 传感器 使 用 。 图 


2.3 描述 了 近期 提出 的 在 一 个 IC AR 
成 热 电 侦 组 的 概念 图 A Cr E Ni 3A FB, fH 2.3 集成 热 电 偶 组 的 传感器 概念 图 


井 放 引 脚 上 的 参考 电路 
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ERREKI 5 — DEAE UL E T XX — UR 0, 
图 2.4 描述 了 一 种 在 i 
380mm 厚 P 2842 Ze BE Ah Al p 
顶部 沉积 的 薄膜 热电 偶 温 度 
传感器 特性 图 [3 。 为 了 让 特 10 500 
征 更 加 明显 ， 采 用 一 个 yum 
厚 的 二 氧化 硅 层 将 传感器 从 
底部 的 电阻 加 热 器 网 络 分 制 
开 。 这 些 热电 偶 是 由 铜 — 康 bn 
铜 构成 的 ， 热 电 偶 的 铜 引 脚 
厚度 大 约 为 140nm， 康 铜 引 "n 
脚 厚度 大 约 为 230nm。 通 过 0 0 
位 于 底部 的 电 阻 加 执 器 在 0.00 100.00 200.00 300.00 400.00 ws 
两 种 材料 的 结合 点 以 及 热电 A 
偶 的 开放 引 脚 之 间 产 生 温度 y= 45.563x | 13.462 
梯度 。 为 了 实现 这 一 目的 ， 2309 
还 需要 引入 一 个 热源 。 连 接 2000 
到 样品 后 侧 且 经 过 校 验 的 热 
敏 电阻 ， 在 产生 温度 梯度 的 
两 个 端点 处 ， 被 当成 热电 侦 rr 
传感器 使 用 。 图 2. 4a 描述 了 500 
当 热 源 被 激活 并 开始 发 热 时 ， 
热电 偶 输 出 电压 随时 间 的 变 -10 
化 关系 ， 图 中 同时 还 提供 了 AT 
热 敏 电阻 的 温差 值 。 图 2. 4b 3 
描述 了 热电 偶 输 出 电压 同 热 图 2.4， 光 刻薄 膜 双 金属 热电 偶 传 感 器 特性 图 


ATIK 
ViuV 


1500 


AV 


电 偶 两 个 端点 间 的 温差 值 关 a) 当 引 入 一 个 热源 时 ， 热 电 偶 输 出 电压 同 热 敏 
系 ， 图 中 温度 范围 (最 大 温 电阻 读 取 的 温度 梯度 之 间 的 瞬 态 关系 图 
] b) 热电 偶 输 出 电压 同 热电 偶 读 取 的 温度 梯度 之 间 的 关系 图 


度 会 超过 环境 温度 607C 以 
E) 同 现代 芯片 的 实际 和 运行 
温度 范围 基本 相同 。 在 此 温度 范围 内 ， 传 感 需 的 输出 电压 同 温度 差 值 之 间 基 本 为 
线性 关系 。 

对 于 集成 到 芯片 内 的 薄膜 热电 偶 ， 设 计 阶 段 以 及 样品 阶段 实验 结果 显示 它们 
已 经 可 以 提供 较 好 的 测量 结果 ,但 是 目前 仍 无 法 形成 完整 的 架构 ， 无 法 被 应 用 到 
商业 产品 上 [3”3] 。 关 于 如 何 将 一 个 热电 偶 传感器 网 络 集成 到 3D IC 中 ， 最 近 一 


(曲线 斜率 为 物理 装置 的 塞 贝 克 系 数 ) 
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项 研究 提供 了 初步 的 指导 意见 3] 。 另 一 方面 ， 对 于 未 来 芯片 内 置 传 感 系统 ， 薄 
膜 双 金属 热电 偶 具 有 独特 的 优势 。 因 此 ， 人 们 对 在 温度 传感器 中 应 用 热电 材料 的 
兴趣 变 得 越 来 越 浓 ， 对 CMOS 芯片 的 其 他 一 些 热管 理 方法 也 非常 期 待 。 热 电 偶 的 
输出 AViic 同 金属 条 的 宽度 以 及 长 度 无 关 ， 同 样 地 ， 它 与 整个 金属 条 上 的 热 特性 
变化 也 没有 直接 关系 。 因 此 ,金属 条 可 以 被 做 成 任意 形状 。 唯 一 需要 放 到 主动 区 
域 的 是 参考 点 传感器 ， 而 参考 点 传感器 可 以 利用 任何 一 个 已 有 传感器 设计 范例 进 
行 构建 。 影 响 输 出 Auc 的 一 个 很 重要 的 参数 是 金属 层 厚 度 ， 当 金属 层 厚 度 接近 
使 用 材料 中 的 电子 平均 自由 程 时 ， 这 一 影响 变 得 尤为 突出 。 在 工艺 技术 和 金属 材 
料 已 定 的 情况 下 ， 金 属 条 的 厚度 是 可 以 被 优化 的 。 

图 2. 5 描述 了 传感器 基本 架构 可 能 需要 用 到 的 器 件 311, 位 于 两 个 不 同 金属 
层 的 金属 条 A 和 金属 条 B 构成 热电 偶 。 两 个 金属 条 结合 点 处 为 热电 偶 结 位 置 ， 
它 又 被 称 为 温度 测量 点 (Sensing point) ， 而 芯片 结 上 关心 的 热点 位 置 被 称 为 温度 
监控 点 (Monitor point) 。 为 使 测量 点 温度 更 加 接近 的 监控 点 温度 ， 需 要 在 两 个 点 
之 间 建 立 一 个 较 好 的 热 耦 合 关系 。 因 此 ， 需 要 在 测量 点 和 监控 点 之 间 通 过 铜 过 孔 
创建 一 个 热 连通 通道 。 同 3D IC 中 用 于 热管 理 的 热 过 孔 相 似 ， 铜 过 孔 的 目的 是 创 
立 一 个 热传导 通道 。 但 是 它 与 热 过 孔 有 所 区 别 ， 热 过 孔 是 将 热传导 到 散热 右上 ， 
传感器 的 铜 过 孔 只 是 在 两 个 点 之 间 起 到 热 连通 作用 ， 而 且 铜 过 孔 是 电 绝缘 的 ， 不 
能 实现 任何 的 电 功 能 。 


图 2.5 连接 到 测量 点 并 输出 电压 差 值 Ar 的 热电 偶 构造 图 


如 图 2.6 所 示 ， 通 过 不 断 地 复制 图 中 的 结构 ， 可 以 在 芯片 内 部 构造 出 大 量 热 
电 偶 的 组 合 。 每 个 热电 偶 都 能 在 开放 引 脚 处 产生 一 个 输出 电压 ， 输 出 电压 正比 于 
远 端 结 与 共用 参考 点 之 间 的 温度 差 值 。 所 有 传感器 的 开放 引 脚 ， 都 可 以 在 临近 参 
考 电路 的 物理 位 置 处 进行 合并 。 为 了 获取 绝对 温度 数值 ， 一 个 单 点 绝对 温度 传 感 
器 需要 被 放置 到 公用 参考 点 处 。 参 考点 可 以 放置 在 忆 片 外 边缘 任 一 可 用 的 自由 空 
隙 处 ， 只 要 该 位 置 处 的 热 波动 最 小 ， 且 温度 仍然 接近 环境 温度 。 满 足 这 一 条 件 ， 
就 可 以 保证 整个 测量 系统 能 够 被 很 好 地 校准 。 图 2. 6 描述 的 是 一 种 可 能 的 参考 电 
路 图 ， 该 电路 由 一 个 开关 和 多 个 热电 偶 输 出 构成 。 因 此 ， 一 个 参考 电路 可 以 同时 
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服务 芯片 内 部 的 多 个 热电 偶 。 受 限于 整个 热电 偶 组 的 尺寸 ， 一 个 或 者 多 个 参考 电 
路 可 以 服务 整个 热电 偶 组 。 最 终 ， 参 考 电路 的 输出 可 以 通过 某 些 ADC 转化 成 一 
个 数字 读 显 值 。 因 为 这 种 热 测量 系统 的 采样 速率 要 求 较 低 ， 因 此 共用 热电 偶 输 出 
开关 、 参 考 热 二 极 管 以 及 ADC 是 可 行 的 。 


1 <a + 


标准 ADC 热 参 考点 TORRES 


器 


[2.6 集成 于 芯片 内 部 作为 温度 传感器 的 双 金 属 热电 偶 组 电路 杠 


2.2.4 其 他 类 型 温度 传感器 


除了 利用 热 二 极 管 和 金属 架构 作为 传感器 外 ， 有 时 也 会 利用 硅 材 料 的 其 他 特 
性 或 者 集成 于 芯片 内 部 主动 元 件 来 构建 温度 传感器 。 其 中 一 个 方案 是 利用 硅 的 扩 
散 率 与 温度 的 关系 构建 传感器 ?7 天] 。 将 一 个 加 热 器 单元 和 热电 堆 分 开放 置 ， 分 
开 距 离 为 *。 热 电 堆 作为 所 有 串联 热电 偶 输出 参数 的 采集 器 ， 是 必 不 可 少 的 。 此 
方案 中 ,通过 P+ 扩 散 区 和 铝 耦 合 来 构成 热电 偶 。 加 热 器 生成 的 附加 热源 ， 通 过 
衬 底 时 会 经 历 一 个 过 滤 过 程 ， 并 产生 一 个 依赖 于 温度 的 扩散 率 。 通 过 一 个 读 值 电 
路 对 热电 堆 的 扩散 率 进行 处 理 ， 将 其 转化 为 温度 数值 。 


2.3 数字 温度 传 感 需 


通过 CMOS 逻辑 构建 的 温度 传感器 称 为 数字 传感器 ， 数 字 传 感 器 有 很 多 种 设 
计 方 法 ， 如 可 以 将 温度 与 CMOS 园 辑 的 阻抗 影响 、 延 迟 影 响 、 漏 电 电流 等 等 的 相 
互 依赖 关系 转化 成 温度 值 。 


2.3.1 基于 MOSFET 输出 电压 /电流 的 温度 传感器 


参考 基于 双 极 型 晶体 管 架 构 模 拟 传感器 的 基本 原理 ， 一 种 可 能 的 数字 温度 传 
感 器 构成 方案 被 提出 ， 即 在 亚 阅 值 范 围 内 用 MOSFET 来 代替 双 极 型 晶体 
管 .3 -42] 。 差 分 电路 的 参考 电压 可 以 通过 MOSFET 的 机 - 源 电压 Vs 获取 ， 而 不 
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再 依赖 双 极 型 晶体 管 的 Vss 来 产生 。 同 基于 双 极 型 晶体 管 的 传感器 一 样 ， 数 字 传 
感 器 中 两 个 MOSFET 之 间 的 机 - 源 电压 Vs 对 温度 也 有 一 定 的 依赖 性 ， 会 产生 一 
系列 相应 的 参数 (如 2.1 节 描 述 的 )。 因 此 ， 各 种 利用 MOSFET 输出 电压 ! 7: 
或 者 输出 电流 1%,?|1 与 温度 的 关系 来 构建 温度 传感器 的 方案 被 提出 。 目 前 数字 传 
感 器 的 最 新 研究 方向 主要 集中 在 如 何 加 强 传感器 对 工艺 变化 的 自我 补偿 。 例 如 ， 
CMOS 传感器 通过 一 个 开关 电容 放大 器 和 采样 、 保 持 电 路 ， 将 共 模 过 程 中 产生 的 
噪声 从 传感器 的 输出 中 消除 ， 从 而 加 强 自 我 补偿 。 

上 面 提 到 的 设计 方法 只 是 学 术 研 究 的 一 个 示例 ， 学 术 研 究 和 商业 应 用 的 最 大 
差别 之 处 无 疑 是 验证 的 规模 。 虽 然 科 研 用 的 温度 传感器 设计 更 加 复杂 (如 工艺 
不 敏感 度 ， 低 功 耗 要 求 等 )， 但 是 它们 的 设计 还 没有 被 批量 验证 过 。 大 部 分 设计 
仍 停留 在 样品 验证 阶段 ， 样 品 验证 的 规模 小 于 10 个 。 而 相似 架构 的 CMOS 传 感 
器 设计 ， 已 在 商业 处 理 器 芯片 上 被 大 规模 制造 ， 并 通过 了 批量 验证 。 例 如 ， 同 用 
在 早期 处 理 器 芯片 中 基于 双 极 型 晶体 管 的 传感器 相 比 ， 用 于 英特尔 32nm 处 理 器 
单元 中 的 CMOS 传感器 压缩 了 所 有 数字 部 分 设计 ， 因 而 显著 降低 了 传感器 所 需 占 
据 的 面积 避 ] 。 这 类 传感器 又 被 称 为 热 探 针 ， 它 可 以 在 略 高 于 80 ~ 100°C 温度 范 
围 ， 并 在 接近 动态 热管 理 系统 DTM 触发 点 温度 附近 被 校正 。 动 态 热 管理 系统 
DTM 触发 点 温度 定义 为 ， 当 芯片 温度 高 过 一 定 温度 数值 时 ， 动 态 热 管理 系统 会 
启动 来 降低 芯片 温度 ，DTM 启动 时 的 温度 数值 即 为 触发 点 温度 。 热 探 针 非 常 适 
用 于 一 些 特 定 的 热点 区 域 ， 这 些 区 域 希望 能 用 较 少 数量 的 原始 传感器 来 实现 较 大 
的 测量 区 域 以 及 较 宽 的 温度 范围 。 热 探 针 电路 构造 包括 三 个 阶段 : 第 一 个 阶段 是 
参考 电压 电路 ， 它 负责 产生 一 个 略 高 于 工艺 阔 值 电压 V, 的 参考 电压 。 第 二 个 阶 
段 是 通过 在 线性 运行 温度 范围 内 ， 植 人 一 个 MOSFET 来 构建 一 个 电流 参考 电路 ， 
主要 原理 是 通过 放大 器 ， 利 用 负 反 馈 电路 将 MOSFET 的 漏 极 电压 改变 到 参考 电 
压 大 小 ， 同 时 将 MOSFET 栅 偏 压 维持 在 高 位 。 在 线性 运行 温度 范围 内 ，MOSFET 
的 电流 可 以 表示 为 材料 特性 和 运行 参数 的 函数 ， 即 

2 
Pinear =# Cat (Ves — Vin )Vps - res) (2.5) 

X (2.5) 中 的 载 流 子 迁 移 率 上 人 PUY A HEV, 都 受 温度 直接 (负面 ) 影响 。 
因此 ， 电 流 源 五 ， 变 成 了 一 个 依赖 于 温度 的 函数 。 在 第 三 个 阶段 ， 通 过 构建 一 
个 电流 镜 补充 参考 电流 ， 并 用 它 来 给 电容 充电 。 输 出 参数 会 一 直 同 参考 电压 进行 
比较 ， 并 产生 一 个 频率 与 温度 耦合 的 脉冲 信和 号。 

另外 一 种 设计 方案 是 利用 界面 陷阱 电荷 泵 !%] ， 通 过 反馈 环 路 构建 从 电流 到 
频率 以 及 从 频率 到 电流 的 两 个 阶段 转化 过 程 。 对 于 频率 控制 的 电流 源 而 言 ， 界 面 
陷阱 电荷 泵 是 必需 的 ， 它 与 另外 一 个 依赖 于 温度 的 电流 源 合成 差分 电流 ， 并 最 终 
转化 为 频率 。 生 成 的 频率 通过 一 个 反馈 电路 反 过 来 又 可 用 于 控制 界面 陷阱 电荷 
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泵 ,通过 反馈 电路 ， 能 在 输出 频率 同 温度 之 间 建 立 一 个 直接 的 对 应 关系 ， 从 而 实 
现 温度 测量 。 


2.3.2 基于 延迟 时 间 的 温度 传感器 


男 一 种 较 流行 的 数字 温度 传感器 设计 方案 ， 是 利用 依赖 于 温度 的 延迟 线 。 基 
于 延迟 线 的 方式 ， 有 很 多 构建 温度 传感器 [3 7 的 方法 。 其 中 一 种 方法 是 建立 两 
条 平行 的 信号 通道 ， 其 中 一 条 温度 敏感 的 信号 通道 通过 一 组 偶数 变频 器 构 成 ， 另 
一 条 对 温度 不 敏感 的 信号 通道 [通过 补偿 技术 构建 。 它 利用 两 个 信号 通道 对 温 
度 敏 感度 的 差异 ， 创 建 一 个 可 以 被 测量 的 、 较 大 的 偏差 值 。 第 二 条 信和 号 通道 甚至 
可 以 对 温度 完全 不 敏感 。 图 2. 7 描述 了 此 类 型 传 感 融 的 结构 。 通 过 一 个 周期 方 波 


音 号 ， 两 个 延迟 线 都 能 被 激活 。 信 ERAI 
号 到 达 每 条 延迟 线 端点 的 时 间 差 值 o 

被 表征 为 脉冲 信号 Ps， 它 的 宽度 MA | -p-[ 
正比 于 温度 ， 脉 冲 信号 通过 异 或 门 nid D 
输出 端 产生 。 WPa) AD) 


FRADE -温度 测 。 图 2.7 延迟 线 传感器 结构 框图 (同步 信号 
量 方法 ， 是 通过 观察 热 效应 下 时 名 。 在 两 条 延迟 线 之 间 传播 的 时 间 差 被 理解 为 
源 的 变化 来 实现 的 ， 它 利用 一 对 延 0 输出 脉冲 ,输出 脉冲 的 带宽 正比 于 温度 ) 

迟 锁 相 环 和 一 个 环形 逆 变 器 链 分 别 
产生 一 个 随 温度 变化 和 一 个 热 稳定 的 延迟 参考 [31 。 

环形 振荡 器 也 会 被 用 于 构建 基于 延迟 时 间 的 温度 传感器 ， 它 有 很 多 种 实现 方 
BEES -6 ， 但 是 共同 的 思路 都 是 利用 一 个 计数 器 或 者 一 个 脉冲 信号 发 生 器 (类 似 
于 上 面 提 到 的 基于 延迟 线 传感器 ， 见 图 2.8)， 将 环形 振荡 器 随 温 度 变化 的 频率 
转化 成 温度 读 值 。 如 果 传 感 器 输出 的 是 脉冲 信号 ， 则 需要 一 个 额外 的 前 端 模块 将 
脉冲 信号 转化 成 温度 读 值 。 如 果 固 定 周期 内 环形 振荡 需 的 循环 次 数 能 通过 使 能 信 
号 收集 到 ， 那 么 计数 器 的 输出 也 可 直接 转化 为 温度 ， 但 是 需要 校正 。 


| Jo DD De, 4 比特 计数 器 
输入 
计数 


M~~ [n:0] 


mi 
em 
bz 


图 2. 8 基于 循环 时 间 的 温度 传感器 〈 通 过 计数 器 来 捕捉 振荡 频率 ， 
频率 与 温度 有 直接 对 应 关系 ) 
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2.3.3 基于 漏电 流 的 温度 传感器 


基于 漏电 流 的 温度 传 感 锅 ， 是 利用 各 种 类 型 CMOS 管 漏 电流 同 温度 的 对 应 关 
系 来 构建 的 。 典 型 的 基于 漏电 流 温度 传感器 的 模拟 部 分 以 及 数字 部 分 ， 都 要 求 较 
小 太 才 以 及 较 少 的 能 量 消耗 。 同 时 ， 为 了 获取 较 好 的 对 工艺 变化 和 声 噪 抗 扰 性 ， 
传 感 咒 自我 调整 以 及 校正 的 投入 可 能 会 变 得 非常 突出 。 因 此 ， 在 能 入 大 量 运 行 温 
JE YE AAA BRAY NR oP, TROD AE URS HE P Je A A LP E KS TB Ze SECUS E B] RC 
类 型 传感器 设计 之 间 ， 需 要 做 一 个 平衡 考虑 。 如 式 (2.6) 所 示 , 漏电 温度 传 感 
需 是 利用 MOSFET 的 亚 阔 值 漏电 流 随 温度 变化 的 特性 ，MOSFET 的 亚 效 值 漏电 流 
是 温度 了 以 及 其 他 参数 以 e 为 底 的 指数 函数 ， 如 一 个 电子 的 电荷 量 g， 波 尔 兹 曼 
常数 Ks ， 设 备 材 料 本 身 的 参数 KK 和 a， 以 及 羡 值 电压 Vi。 

Tp = ke~ SED (2.6) 

一 种 早期 的 实现 方式 是 利用 存储 在 一 个 4T 内 存单 元 中 的 电荷 衰退 时 间 来 进 
行 温度 测量 '$l。 它 将 比较 器 和 反馈 路 径 中 的 反 转 触发 器 连接 到 字 线 控制 端 ， 比 
较 器 的 一 端 输入 固定 在 低压 90mV ， 另 外 一 端 连接 到 内 存单 元 的 输出 端 。 一 个 完 
全 充电 状态 的 内 存单 元 输出 会 引起 比较 器 的 输出 值 变 大 ， 从 而 激活 反 转 触发 吉 ， 
并 阻止 对 内 存单 元 进一步 充电 。 此 后 ， 依 据 内 存单 元 内 部 MOSFET 的 亚 阔 值 漏 
电机 制 ， 存 储 的 电荷 开始 泄漏 。 当 内 存单 元 的 输出 降 到 阔 值 以 下 时 ， 比 较 器 的 输 
出 值 会 变 小 ， 反 转 触发 需 的 状态 也 同时 被 改变 ， 相 应 的 字 线 端 重新 开始 新 的 一 轮 
充电 过 程 。 同 时 ， 比 较 器 缓冲 输出 高 脉冲 ， 变 为 传感器 后 端 输出 。 通 过 传感器 前 
端 ， 实 现 高 脉冲 信和 号 的 宽度 同 前 端 温度 读 值 相关 联 。 图 2. 9 所 示 为 此 类 型 传感器 


的 工作 原理 图 。 


WPa = fT) 


反馈 控制 
图 2.9 漏电 流传 感 需 侦 测 SRAM 单元 内 依赖 于 温度 的 漏电 率 的 工作 原理 图 (通过 


比较 器 来 捕捉 一 个 47T 内 存单 元 的 漏电 率 ， 将 其 转化 成 输出 脉冲 信号， 脉冲 信号 的 
宽度 正比 于 漏电 率 ， 相 应 地 脉冲 信号 同 温度 之 间 也 有 直接 对 应 关系 ) 


另 一 种 漏电 电流 传感器 实现 方式 ， 则 是 通过 MOSFET 的 亚 阔 值 漏电 流 路 径 ， 
将 温度 同比 较 器 放电 时 间 进 行 关联 1.%] 。 比 较 器 同一 对 MOSFET 管 同 时 使 用 ， 该 
对 MOSFET 管 中 的 上 拉 PMOS 管 负 责 给 比较 器 充电 并 产生 高 脉冲 信和 号， 而 下 拉 
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NMOS 管 则 负责 提供 放电 路 径 。 比 较 器 上 的 电压 会 驱动 一 个 转化 器 ， 转 化 器 的 输 
出 将 会 以 一 种 低 脉 冲 的 方式 呈现 ， 脉 冲 的 宽度 同 温度 大 小 呈 指 数 级 关系 。 通 过 传 
感 融 的 前 端 结构 ， 将 脉冲 信号 转化 成 温度 读 值 。 

另外 一 种 采用 放电 比较 咒 的 增强 型 温度 传 感 顺 ， 则 利用 两 个 不 同 参考 电压 下 
比较 器 放电 速率 的 测量 值 的 比值 "9,%] 。 设 置 两 个 不 同 参考 电压 的 目的 是 为 了 消 
除 工艺 变化 的 影响 。 传 感 器 会 通过 一 个 额外 的 充电 泵 来 强化 比较 器 的 充电 电路 ， 
图 2. 10157: 为 漏电 传感器 侦 测 放电 时 间 的 原理 图 。 
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来 侦 测 比较 融 的 漏电 率 ， 并 将 其 转化 输出 脉冲 信号 ， 输 出 脉冲 信号 的 宽度 成 同 温度 直接 相关 ) 


2.4 传感器 前 端 | 


在 前 面 章节 中 ， 我 们 阐述 了 利用 热 二 极 管 结构 和 热电 偶 作 为 模拟 传感器 的 原 
理 ， 简 单 点 理解 就 是 将 它们 输出 的 电压 或 者 电流 转化 为 数字 输出 值 ， 即 温度 读 
值 。 最 终 ， 温 度 读 值 会 被 提供 给 芯片 的 后 续 热 管理 单元 。 通 常情 况 下 ， 温 度数 值 
会 同 存储 在 寄存 顺 中 的 浆 值 进行 比较 ， 它 代表 了 一 种 关键 靖 值 。 假 如 同 预存 储 的 
国 值 比较 结果 显示 ， 浆 值 已 经 被 超过 ， 则 硬件 同 / 或 系统 软件 被 激活 ， 并 采取 相 
应 的 热管 理 动作 。 

采用 各 种 ADC (模拟 -数字 转化 咒 ) 进行 转化 时 ， 它 们 中 的 大 部 分 都 会 将 
传感器 的 输出 值 转化 为 绝对 值 。 目 前 主要 有 三 类 前 端 转化 器 ， 负 责 对 温度 传 感 后 
端 输 出 值 进行 转化 ， 分 别 为 : Sigma - Delta ADC, SAR (Successive approximation 
register， 逐 次 求 近 寄存 器 ) ADC 以 及 脉冲 - 数字 转化 器 (PTDC ) 。 需 要 注意 的 
是 ,不 仅仅 基于 二 极 管 / 唱 体 管 的 模拟 型 温度 传感器 的 前 端 , 基于 MOSFET 的 数 
字 型 传感器 的 前 端 同样 也 需要 一 个 转化 咒 ， 将 电压 /电流 转化 成 温度 读 值 。 其 他 
类 型 数字 型 传感器 也 会 采用 时 间 - 数字 转化 器 ， 将 输出 周期 输出 的 脉冲 信号 或 者 
频率 信和 号 转化 成 温度 读 值 。 
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在 一 些 动态 热管 理 的 应 用 场景 ， 可 以 通过 额外 的 计算 方式 ， 将 传感器 原始 粗 
米 的 温度 读 值 进一步 处 理 。 例如 ， IBM Power7 处 理 器 芯片 利用 一 个 模拟 传感器 
同 ADC 前 端 进行 耦合 ， 然 后 通过 集成 在 芯片 内 部 的 专门 微 控制 器 ， 由 软件 将 传 
感 需 输出 数值 处 理 成 一 个 预先 设 定 的 多 项 式 曲线 。 这 个 算法 被 预 设 到 热 监控 方法 
中 ， 针 对 每 个 必 片 内 置 传 感 需 定制 不 同 的 多 项 式 曲线 ， 用 于 生产 后 的 测试 以 及 每 
个 芯片 或 传 感 需 的 特征 校正 。 

在 接 下 来 的 章节 里 面 ， 我 们 将 会 逐个 阐述 这 些 前 端 结构 的 基本 工作 原理 。 


2.4.1 温度 传感器 的 Sigma - Delta ADC 


Sigma - Delta ADC 特别 适合 以 下 应 用 场景 : 温度 传感器 不 需要 产生 高 频 信 
号 ， 但 是 需要 在 合理 的 尺寸 大 小 和 合理 的 功 耗 消 耗 前 提 下 ， 提 供 较 高 的 分 辩 率 。 
这 种 转化 器 采用 Sigma - Delta ADC 调制 峰 ， 将 输入 电压 转化 成 一 种 被 称 为 数字 
比特 流 的 输出 [9 。 Sigma - Delta ADC 调制 器 通常 需要 比 Nyquist 定理 有 更 快 的 采 
样 速率 ， 因 此 ， 它 们 也 被 称 为 细 分 采样 。 图 2. 11 阅 述 了 一 阶 模块 的 工作 原理 。 
在 调制 阶段 使 用 一 个 差分 放大 器 、 一 个 积分 器 和 一 个 比较 器 对 缓慢 变化 的 信和 号 进 
行 细 分 采样 ;而 高 阶 的 转化 器 会 按 顺 序 多 次 的 重复 调制 过 程 。 输 入 电压 会 被 持续 
积分 ， 每 当 放 大 器 的 浆 值 被 超越 时 ， 就 会 产生 一 个 单 比特 输出 。 同 时 通过 差分 放 
大 器 将 参考 电压 从 输入 电压 中 扣除 ， 并 通过 一 个 反馈 电路 重 置 积分 器 的 输出 。 在 
积分 融 状 态 从 比较 器 高 闷 值 过 渡 到 低 国 值 期 间 ， 比 较 带 输出 的 比特 会 持续 保持 在 
高 位 状态 。 过 渡 完 成 后 ， 比 较 器 的 输出 会 被 设置 为 0。 基 于 这 种 基本 运行 原理 ， 
调制 希 会 产生 一 个 细 分 采样 的 比特 流 。 通 过 一 个 均值 滤波 器 和 一 个 抽取 滤波 需 ， 
将 比特 流 最 终 转 化 成 一 个 数字 输出 值 。 
分 离 式 的 芯片 外 置 传感器 可 以 直接 稳定 地 与 另外 一 个 分 离 式 的 ADC IC 进行 
通信 。 世 片 内 置式 的 传感器 则 需要 专门 设计 开发 一 个 转化 电路 。 通 常 需要 引入 高 
级 特征 来 强化 传感器 的 稳定 性 以 及 对 工艺 的 独立 性 [99-71 。 

放 人 器 积分 器 比较 器 
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图 2.11 一 阶 Sigma - Delta 调制 器 ADC 工作 框图 


模拟 后 端 


输出 


2.4.2 温度 传感器 的 SAR ADC 
一 个 n 比特 SAR ADC 会 采用 一 个 比较 器 ， 通 过 比较 器 接收 锁 存 输入 电压 
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Vin All n 比特 DAC 输出 。DAC 数值 取 自 SAR 寄存 器 ，DAC 初始 值 通常 为 预 设 的 
运行 温度 范围 中 间 值 。SAR 寄存 器 会 尝试 对 不 同比 特 位 值 进 行 计 数 ， 起 始 值 为 
最 高 有 效 比 特 位 (MSB), ， 终 止 值 为 最 低 有 效 比 特 位 。 通 过 DAC 产生 相应 的 参考 
电压 ， 参 考 电 压 也 会 同 输入 电压 进行 比较 。 假 如 输入 电压 Vi BE, PRAE ASA 
出 将 较 高 ， 引 起 寄存 器 中 MSB 相应 地 被 设 为 大 值 ， 否 则 MSB 将 会 被 设置 成 0。 
通过 一 系列 连续 的 步骤 ， 寄 存 器 会 监控 比较 器 的 输出 ， 查 看 二 进 制 计算 器 的 数值 
是 否 大 于 或 者 小 于 模拟 信和 号 输入 值 ， 并 相应 地 调整 比特 数值 。 同 时 ， 比 较 器 输出 
也 会 驱动 一 个 控制 电路 ， 同 SAR 寄存 器 进行 协同 。 接 着 进一步 处 理 寄 存 器 中 下 
一 个 有 效 的 比特 位 ， 并 将 Vi\ 同 新 的 Vary 进 行 比 较 。 通 过 这 种 迭代 过 程 ， 经 过 nn 
轮 循环 后 ， 输 入 电压 数值 将 会 被 转 比较 器 

化 成 n 比特 数字 输出 值 ， 因此， SARS ME 
SAR ADC 通常 一 次 只 会 产生 一 个 制 电路 
比特 输出 ， 图 2. 12 描述 了 SAR 
ADC 的 主要 构成 器 件 。 在 芯片 内 部 
导入 集成 了 模拟 型 传感器 后 端的 
SAR ADC 的 方案 在 本 章 参 考 文献 
[51, 52, 72] 已 被 提出 。 


2.4.3 温度 传感器 的 PTDC 


另 一 种 用 作 横 拟 温度 传 感 顺 前 端的 转化 器 ， 称 为 PTDC 转化 器 。PTDC 转化 
器 特别 适用 于 产生 电流 输出 的 接口 传感器 。PTDC 转化 器 结构 一 般 采 用 两 个 电 
容 ， 在 开始 进行 转化 时 ， 它 们 的 电压 会 立即 被 预 充 电 到 参考 电压 值 。 然 后 ， 依 赖 
于 温度 的 电流 输出 Ji 和 参考 电流 (类似 Ver) 开始 对 两 个 电容 进行 放电 。 通 过 
比较 器 输出 电压 驱动 的 缓冲 器 ， 对 每 个 充分 放电 的 比较 器 各 产生 一 个 开关 信和 号 。 
开关 信号 的 计时 时 间 与 比较 器 放电 时 间 差 值 直接 相关 ， 因 此 与 依赖 于 温度 的 电流 
也 直接 相关 。 计 时 时 间 的 差异 将 会 产生 一 个 脉冲 ， 脉 冲 的 宽度 将 会 在 循环 计数 中 
被 测量 ， 并 最 终 被 转化 为 温度 数值 。 

上 述 方案 的 一 种 变更 方案 则 不 需要 在 环 状 结构 中 通过 模拟 带 件 侦 测 脉冲 
(类 似 图 2. 8 描述 的 结构 )， 而 是 要 在 循环 的 每 个 迭代 中 按照 固定 值 来 缩小 脉冲 。 
这 种 结构 会 连接 到 计数 右上 ， 通 过 电路 延迟 线 记录 脉冲 消失 前 的 往返 次 数 。 


2.5 心 片 内 置 温度 传 感 闫 的 设计 挑战 


温度 传感器 最 大 的 设计 和 制造 的 挑 成 为 : 如 何 降低 非 理 想 性 ， 如 何 获得 良好 
的 对 工艺 变化 、 电 压 变 化 、 热 变化 的 抗 扰 性 ， 以 及 如 何 进 行 有 效 校正 。 男 外 ， 如 


数字 
输出 


图 2.12 FEF SAR 的 模拟 -数字 (A-D) 
转化 前 端 反馈 环 路 
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何 减 小 传感器 尺寸 以 及 降低 消耗 的 功率 也 是 一 个 非常 重要 的 考量 因素 ， 因 为 它们 


与 热 监控 系统 的 粒度 等 级 、 减 轻 高 密度 封装 以 及 热 影响 显著 区 域 的 传感器 布局 息 
息 相关 。 


2.5.1 理想 性 和 线性 度 


基于 双 极 型 晶体 管 的 模拟 传 感 带 设计 过 程 中 一 个 最 突出 的 挑战 为 ， 如 何在 有 
设备 非 理 想 性 以 及 工艺 变化 的 前 提 下 获得 理想 的 精度 。 首 先 ， 一 个 模拟 传感器 的 
精度 取决 于 用 于 偏 置 双 极 型 晶体 管 结构 固定 电流 源 的 精度 。 为 了 构建 线性 的 、 稳 
定 的 参考 电流 ， 这 些 用 作 参 考 和 补偿 的 次 部 件 需要 使 用 各 种 调节 电路 和 稳定 强化 
措施 。 设 计 团 队 遇 到 的 最 大 挑战 变 为 ， 如 何在 较 小 的 尺寸 和 消耗 较 低 的 功率 前 提 
下 ， 通 过 强化 调节 电路 的 电压 和 电流 来 获得 理想 的 稳定 性 。 

由 于 变化 因素 在 设计 和 制造 过 程 中 会 趋 于 相互 抵消 ， 因 此 电路 中 的 差分 信号 
本 身 就 具有 高 度 可 重复 性 ， 而 且 误差 率 低 至 +0. 1% 15] 。 但 是 通过 其 中 一 个 双 
极 型 晶体 管 基 极 获取 的 间隙 参考 电压 ， 仍 然 存 在 不 准确 的 可 能 ， 原 因 是 二 极 管 
PN 结 的 非 理 想 性 导致 Vss 和 温度 的 实际 关系 并 非 为 线性 。 图 2. 13 描述 了 此 现 
象 。 图 2. 13a 描述 了 如 果 二 极 管 前 向 偏 置 电 压 同 温度 关系 是 完全 线性 的 ， 它 所 具 
备 的 理想 特征 。 图 2. 13b 则 描述 了 Vss 作 为 温度 函数 的 非 理 想 化 特征 ，Vsp 和 
Jer 都 会 产生 一 个 背离 理想 曲线 的 曲率 。 对 于 利用 间隙 参考 电压 作为 输入 的 传 感 
器 而 言 ， 它 们 的 ADC 前 端 就 会 受到 非 理想 化 的 影响 。 

电压 电压 


Veer = OVBE1 + Vee SHAR VkEF 


JEMA VR 


温度 


b) 

图 2.13 ”二极管 理想 型 性 和 非 理 想 特 征 对 比 以 及 对 传感器 工作 的 影响 
a) 假定 二 极 管 电压 同 温度 的 关系 是 线性 的 ， 前 向 偏 置 二 极 管 电压 和 间隙 参考 电压 的 特征 
b) 假定 二 极 管 电压 同 温度 的 关系 是 非 线 性 的 ， 前 向 偏 置 二 极 管 电压 和 间隙 参考 电压 的 曲率 


各 种 用 于 强化 基本 传感器 结构 的 措施 早已 被 提出 ， 目 的 是 在 较 宽 的 运行 范围 
内 减弱 曲率 ， 以 获得 较 好 的 线性 特性 2, ,7 。 其 中 一 种 方法 为 微调 法 ， 它 又 被 
称 为 通过 编程 的 离散 步骤 改变 模拟 电路 的 配置 过 程 。 对 于 温度 传感器 而 言 ， 这 种 
方法 的 一 种 可 能 实现 方式 为 : 在 差分 电路 上 增加 一 个 可 编程 的 偏转 电流 源 来 进行 
补偿 ， 从 而 均衡 任意 设备 的 不 匹配 现象 。 另 外 一 种 获取 良好 线性 特性 的 方法 则 
是 ， 通 过 增加 一 个 可 编程 电阻 调整 传 感 咒 电路 的 输出 电压 。 所 有 被 提出 的 强化 方 
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法 中 ， 相 对 成 本 较 低 的 修正 方法 是 调整 放大 系数 c， 放 大 系数 一 般 用 于 从 Ves 中 
获取 Vagr。 采 用 了 延迟 线 的 DTS (数字 型 温度 传感器 ) 时 域 ， 同 样 也 会 受到 非 
理想 性 的 影响 。 依 赖 于 延迟 线 的 温度 会 偏离 假定 的 理想 线性 曲线 ， 在 特征 曲线 上 
呈现 出 一 定 的 曲率 。 传 感 器 的 此 类 误差 同样 也 可 以 通过 相似 的 方式 进行 调整 ， 即 
调整 相对 应 参考 延迟 线 的 曲率 。 它 需要 改变 用 在 参考 延迟 线 中 单元 尺寸 ， 通 过 引 
人 一 个 反 向 曲率 来 抵消 依赖 于 温度 延迟 线 遭 受 的 非 线性 影响 ?1 。 

总 体 而 言 ， 上 述 的 修正 方法 ， 要 么 会 让 每 个 传感器 在 设计 中 增加 不 可 忽略 的 
面积 、 消 耗 额外 的 功 耗 ， 要 么 设计 较 简单 但 在 校正 时 需要 更 多 的 投入 。 


2.5.2 ”对 变化 的 鲁 棒 性 


基于 双 极 型 晶体 管 架构 的 模拟 温度 传感器 ， 尽 管 有 很 多 通过 占用 更 大 面积 
降低 非 理 想 性 影响 解决 方案 ， 但 是 它们 仍然 面临 未 来 IC 技术 发 展 趋势 挑战 。 双 
极 型 晶体 管 结 构 无 法 大 幅度 减 小 尺寸 以 满足 CMOS 工艺 缩减 结 点 的 要 求 ， 同 时 也 
无 法 满足 CMOS 逻辑 电路 其 余部 分 对 供电 电压 逐步 下 降 的 需求 。 而 旨 在 用 于 
45nm 及 以 下 的 CMOS 处 理 结 点 温度 传感器 ， 当 它们 的 尺寸 很 小 、 功 耗 很 低 时 ， 
温度 传感器 就 很 难 同 低 于 1. 2V 的 供电 电压 进行 对 接 ， 有 效 对 接 变 成 了 模拟 传 感 
器 的 一 种 奢望 。 为 了 降低 此 风险 ， 早 期 的 解决 方案 是 采用 由 一 个 充电 泵 、 电 压 控 
制 振荡 器 、 稳 压 器 构成 的 混合 电路 ， 利 用 混合 电路 提高 温度 传感器 的 供电 电压 [21 。 
事实 上 ， 这 种 现象 也 导致 人 们 对 设计 CMOS 传感器 电路 的 兴趣 变 得 越 来 越 浓 。 

对 于 双 金 属 热电 偶 ， 因 为 它 的 热 感应 电压 是 金属 材料 本 身 的 固有 特性 ， 因 此 
它们 不 容易 受 工 艺 变化 的 影响 。 当 用 传统 方法 构建 只 有 一 个 绝对 参考 点 的 传感器 
时 ， 它 才 会 遇 到 特定 设计 方法 带 来 的 挑战 。 另 一 方面 ， 热 电 偶 传 感 器 系统 需要 在 
CMOS 工艺 中 引入 两 种 金属 材料 ， 以 及 设计 额外 的 Vias ( 通 孔 ) 。 铜 可 用 作 热 电 偶 
的 其 中 一 个 金属 条 ， 这 已 经 成 为 CMOS 工艺 的 一 部 分 ， 也 没有 太 多 额外 的 复杂 度 。 

同 工 艺 变化 一 样 ， 良 品 率 也 是 DTS 设计 的 挑战 。 早 期 的 处 理 器 一 般 只 有 和 较 
少 的 传感器 (2 ~3 个 ) ， 因 此 在 传感器 的 设计 过 程 中 可 以 不 用 过 多 地 关注 面积 
用 率 。 在 给 定 的 面积 区 域内 ， 电 路 也 可 以 被 设计 得 足够 可 靠 去 抵抗 各 种 变化 带 来 
的 影响 。 传 感 器 的 数量 相对 整个 处 理 器 电路 而 言 较 小 ， 因 此 每 个 传感器 对 良品 率 
的 影响 也 非常 小 。 而 在 新 一 代 处 理 器 中 特别 是 多 核 处 理 器 芯片 ， 热 监控 变 得 越 来 
越 重 要 ， 趋 势 也 随 之 发 生 了 变化 。 高 端的 多 核 处 理 器 芯片 会 包含 非常 多 的 传 感 
ART) ， 传 感 器 不 良 率 的 影响 变 得 不 可 忽视 。 此 外 ， 由 于 在 高 级 处 理 器 结 点 内 一 
般 都 集成 DTS, ， 器 件 参 数 的 随机 变化 (nbi Hs Va ARRATEK K u) 带 
来 的 影响 变 得 越 来 越 突出 。 如 何 设 计 一 个 能 达到 其 余数 字 系 统 期 望 良 品 率 的 温度 
传感器 成 为 一 个 非常 大 的 挑战 。 

图 2. 14 描述 了 一 种 用 于 分 析 基 于 二 极 管 架构 模拟 温度 传感器 良品 率 的 方 
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78) 。 图 中 ， 共 有 1000 个 芯片 被 用 于 实验 ， 每 个 芯片 都 经 历 了 工艺 和 温度 变 
化 ， 而 且 在 芯片 结 上 集成 有 温度 传感器 。 通 过 一 个 电路 级 分 析 工 具 (例如 ， 
HSPICE) 构建 合适 的 技术 模型 (IBM 10SF 65nm 技术 模型 被 用 在 该 案例 中 ) ， 对 


传感器 的 特 行 


FE 表现 进行 模拟 分 析 。 每 个 芯片 尺寸 被 固定 成 能 代表 各 上 自 设计 的 典型 


值 ， 其 面积 被 划分 为 四 个 1/4 圆 ， 并 且 在 每 个 1/4 圆 的 中 心 布置 一 个 热 二 极 管 ， 
案例 中 使 用 的 热 二 极 管 是 运行 在 线性 区 域 的 MOSFET。 案 例 采用 蒙特 卡 罗 模 拟 分 
Br, Cui Y PR DUE: 


图 2. 14 ”蒙特 卡 洛 分 析 法 流程 图 


扰动 晶体 管 的 长 度 和 宽度 ( 商 斯 分 布 ， 


Sigma=15%， 考 虑 空间 相关 性 ) 


Y 
fiib E 


: 


随机 产生 一 个 芯片 的 温度 由 线 


评估 测量 识 关 
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收集 系统 测量 精度 统计 数据 


(评估 工艺 变化 情况 下 传感器 设计 的 良品 率 ) 
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1) 参数 扰动 : 第 一 步 ， 唱 体 管 的 长 度 和 宽度 被 扰动 ， 其 相应 的 空间 相关 性 
也 会 发 生 扰动 。 通 常 假定 扰动 符合 高 斯 分 布 。 基 于 当前 的 工艺 水 平 ， 对 高 斯 分 布 
的 偏离 度 可 以 被 设置 为 任 一 期 望 值 。 分 析 案 例 中 ， 它 被 设置 为 15% 。 

2) 传感器 校正 : 第 二 步 ， 热 二 极 管 将 会 被 校正 。 

3) 热 监控 精度 评估 ， 第 三 步 ， 通 过 随机 生成 的 芯片 温度 曲线 来 评估 热 监控 
系统 的 精度 。 案 例 中 ， 温 度 簇 的 上 限 和 下 限 分 别 被 设 为 33 和 115% 。 每 个 温度 
曲线 ， 通 过 从 校正 过 的 传感器 电路 仿真 分 析 中 获得 前 向 偏 置 电压 ， 对 每 个 二 极 管 
附近 的 温度 进行 评估 。 每 个 二 极 管 测量 偏差 定义 为 一 个 绝对 差 值 。 测 量 偏差 是 指 
二 极 管 附近 预计 温度 和 实际 温度 的 差 值 。 我 们 定义 芯片 内 置 温度 监控 系统 的 精度 
为 : 所 有 芯片 内 置 二 极 管 传感器 在 其 温度 曲线 上 的 最 大 测量 偏差 值 。 每 一 批 忌 
的 平均 、 最 好 、 最 差 精度 ， 及 其 对 测量 精度 的 标准 偏离 程度 都 能 被 计算 。 案 例 
中 ,平均 精度 被 定义 为 1000 个 芯片 的 平均 精度 ， 最 好 、 最 差 精 度 以 及 对 测量 精 
度 的 标准 偏离 程度 通过 相似 的 方式 进行 定义 。 

图 2. 15 和 图 2. 16 描述 了 两 种 可 能 的 工艺 分 布 ， 它 们 可 以 在 精细 优化 过 的 传 
感 器 网 络 中 被 观察 到 。 图 2. 15 和 图 2. 16 的 传感器 分 别 通过 两 种 不 同 的 方法 进行 
校正 。 图 2. 16 中 分 析 用 的 传感器 校正 更 加 全 面 、 细 致 ， 我 们 将 会 在 接 下 来 章节 
中 详细 地 介绍 这 一 校正 过 程 及 其 影响 。 

同时 我 们 也 发 现 ， 由 于 传感器 设计 不 同 ， 工 艺 变化 的 影响 也 会 呈现 不 同 的 严 
重 程度 。 示 例 中 ， 专 门 选用 了 一 个 较 差 的 校正 方案 进行 优化 设计 ， 以 获得 LCA 
右 的 平均 精度 。 如 果 采 用 较 优 的 校正 方法 ， 可 以 将 精度 提高 到 小 于 0. 6%C 。 

无 论 如 何 ， 仍 有 少 部 分 芯片 的 测量 精度 较 差 (大 于 3% ) 。 这 是 由 于 这 些 芯 
片 的 一 些 晶体 管 扰动 通道 长 度 太 小 〈 小 于 25$nm) 导致 的 。 晶 体 管 呈 现 的 高 阶 非 
线性 ， 影 响 了 监控 系统 的 测量 精度 。 


2.5.3 温度 传感器 的 校正 


在 制造 芯片 内 置 温 度 传 感 硕 过 程 中 ， 兄 一 个 大 的 成 本 项 为 校正 过 程 。 校 正 主 
要 用 于 消除 测量 装置 中 偏差 融 件 导致 的 系统 偏差 。 对 于 温度 传 感 吉 而 言 ， 校 正 的 
目标 是 调整 传感器 的 原始 响应 特性 ， 以 实现 具体 测量 点 的 摄氏 温标 测量 值 与 实际 
温度 值 相 匹配 ， 保 持 较 小 的 偏差 。 在 一 些 处 理 需 芯片 中 ， 校 正成 本 是 如 此 突出 ， 
以 至 于 它们 只 能 简单 地 采用 了 一 些 未 经 校正 的 传感器 来 降低 成 本 。 此 类 传感器 的 
应 用 需要 基于 一 定 的 假设 条 件 ， 即 芯片 壳 的 平均 温度 范围 不 会 影响 芯片 可 靠 性 ; 
偶尔 地 超过 温度 浆 值 而 导致 热管 理 干 预 机 制 延 迟 激活 的 行为 ， 不 会 危害 芯片 标 称 
AY TDP 数值 。 无 论 如 何 ， 这 些 假设 条 件 都 不 适用 于 用 作 监 控 、 保 护 用 途 的 温度 
传感器 和 芯片。 特别 需要 指出 的 是 ， 随 着 冷却 成 本 在 整个 能 源 消耗 成 本 中 占 比 越 
来 越 高 ， 以 及 执行 重 载 模式 下 (如 boosting) 最 大 功 耗 越 来 越 大 ， 系 统 越 来 越 倾 
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图 2.15 蒙特 卡 洛 法 分 析 法 : 分 析 工 艺 变 化 对 集成 到 这 批 芯片 中 的 模拟 温度 传感器 影响 ， 
在 一 个 高 性 能 处 理 器 之 后 这 批 芯片 的 尺寸 和 功率 密度 被 模拟 分 析 


系统 测量 精度 /°C 


0 100 — 200 30 400 500 600 700 800 900 1000 
心 片 样 术 数 

图 2. 16 蒙特 卡 洛 法 分 析 法 : 分 析 工 艺 变化 对 集成 到 这 批 芯片 中 的 模拟 温度 传感器 影响 ， 

所 有 的 分 析 参 数 同 图 2. 15 中 参数 保持 一 致 ， 除 了 校正 步 又。 图 中 的 校正 采用 了 更 加 准确 、 

成 本 更 高 的 方法 


向 于 在 非常 接近 发 生 热 突 发 事件 的 温度 国 值 点 附近 运行 很 长 时 间 ( 热 突 发 事件 
发 生 时 ， 热 管理 干预 机 制 会 被 激活 ) 。 因 此 ， 人 们 对 世 片 内 置 传感器 空间 分 辩 率 
的 细 粒 度 及 高 精度 的 期 望 越 来 越 高 。 温 度 传 感 右 的 校正 技术 主要 分 为 两 大 类 ， 即 
单 点 校正 和 多 点 校正 。 

温度 传 感 带 的 校正 过 程 包括 : 引入 一 个 外 部 传 感 融 作为 附属 装置 ， 用 于 校 验 
测量 系统 的 真实 温度 ， 再 将 测量 系统 中 原始 传感器 的 读 值 同 参考 传感器 测量 值 进 
行 对 比 。 对 于 不 同类 型 的 传感器 ， 步 又 会 略 有 不 同 。 

在 校正 过 程 中 ， 心 片 被 放置 到 一 个 温度 已 知 的 、 固 定 的 环境 中 进行 测量 ， 而 
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芯片 在 该 环境 中 放置 时 间 要 足够 长 。 在 固定 温度 环境 中 ， 收 集 所 有 温度 传感器 

的 响应 特性 ， 并 且 测 量 每 个 模拟 传感器 的 电压 响应 曲线 。 归 纳 分 析出 每 个 二 极 管 
结 的 电压 - 温度 的 响应 系数 ， 响 应 系数 会 被 编程 写 到 熔断 器 或 者 特别 的 寄存 器 
中 。 通 过 在 一 个 可 编程 电阻 上 串联 一 个 二 极 管 (BJT/MOSFET 结 ) ， 可 以 在 传 感 
器 上 实现 Trimming ( 修 调 ) ， 从 而 对 电流 源 和 温度 变化 进行 部 分 补偿 。 另 一 个 需 
要 被 校正 的 重要 参数 是 传感器 的 前 端 ADC。 已 广泛 用 于 商业 产品 的 一 个 解决 方 
2557), 在 校正 过 程 中 ， 通 过 连接 到 芯片 封装 上 的 、 非 芯片 内 置 的 电压 源 ， 提 
供 一 个 高 精度 的 参考 电压 ， 然 后 再 通过 芯片 内 置 的 可 编程 电阻 梯 将 高 精度 电压 转 
化 为 ADC 的 输入 。 通 过 高 精度 电压 源 ， 可 以 在 很 宽 的 电压 范围 内 ， 实 现 多 次 循 
环 转化 ， 每 次 循环 中 电压 增加 步 长 可 设 为 较 小 值 ， 从 而 制作 出 一 张 ADC 输出 随 
输入 电压 变化 的 表格 。 在 实际 应 用 中 ， 利 用 存储 在 表格 中 的 信息 ， 对 ADC 输出 
进行 外 推 并 总 结 出 一 个 有 效 的 ADC 输出 ， 最 终 可 将 ADC 输出 转化 为 温度 读 值 。 
在 生产 测试 中 ， 通 过 相似 的 方法 来 对 DTS 进行 校正 。 例 如 ， 在 已 知 温度 下 ， 通 
过 记录 振荡 器 中 温度 转化 次 数 来 进行 传感器 校正 。 

阻 值 型 传感器 的 校正 需要 在 已 知 温度 下 进行 测量 ， 并 通过 Loopup 函数 表 或 
者 等 式 归 纳 总 结 器 件 阻 值 同 温度 的 关系 。 用 在 IBM Power6 处 理 器 中 的 热 敏 电阻 
就 采用 了 这 一 步 又， 记录 生成 的 线性 拟 合 关 系 并 作为 处 理 器 重要 参数 的 一 部 分 ， 
线性 拟 合 关系 被 存储 在 与 每 个 处 理 芯 片 相关 的 可 外 部 电路 擦 除 的 且 可 编程 的 只 读 
存储 器 中 (EEPROM) 。 

热 二 极 管 或 者 阻 值 型 传感器 的 温度 与 阻 值 关系 可 通过 了 大 量 的 实验 数据 进行 
理想 化 拟 合 。 但 是 ， 每 个 单一 芯片 的 拟 合 过 程 都 会 很 漫长 。 特 别 是 当 芯 片 内 置 传 
感 器 的 数量 越 来 越 多 ， 因 为 成 本 的 缘故 ， 对 每 个 传感器 进行 单独 校正 越 来 越 不 被 
人 允许。 为 了 限制 这 方面 的 过 多 投入 ， 大 多 数 温度 传感器 的 校正 ， 通 常会 采用 两 点 
法 或 者 三 点 法 进行 线性 拟 合 。 对 于 特定 应 用 的 传感器 ， 如 果 人 允许 过 多 的 投入 或 者 
由 于 测量 精度 的 需要 ， 则 可 以 采用 更 加 精细 的 分 段 线性 拟 合 的 方法 进行 校正 。 

图 2. 17 描述 了 两 点 法 和 三 点 法 拟 合 校 正 的 原理 。 在 三 点 法 校正 的 过 程 中 ， 
芯片 被 放置 到 固定 的 三 个 温度 环境 下 7 、7T, 和 7T。 线 性 拟 合 可 以 按照 图 2. 17a 
所 示 的 分 段 法 进行 ， 或 者 按照 图 2. 17b 所 示 的 直接 线性 法 进行 。 三 点 分 段 拟 合法 
校正 能 很 好 适用 于 任何 非 线 性 的 情况 ， 并 提供 最 高 的 测量 精度 。 通 过 一 个 单一 校 
正 公 式 进行 线性 拟 合 是 一 种 近似 的 方法 ， 即 
温度 = 斜率 x 温度 系数 + 纵 坐 标 交 叉 点 (2.7) 

在 两 点 法 校正 过 程 中 ， 芯 片 被 放置 在 固定 的 两 个 温度 环境 下 OT, 和 7,。 在 该 
温度 条 件 下 ， 测 量 每 个 热 二 极 管 的 前 向 偏 置 电压 。 通 过 以 上 两 个 温度 点 下 的 测量 
数据 ， 拟 合 出 每 个 二 极 管 的 电压 - 温度 的 曲线 。 两 点 法 校正 需要 在 两 个 温度 点 进 
行 足 够 次 数 的 测量 ， 获 取 位 于 运行 温度 范围 内 的 多 个 数据 点 ， 从 而 归纳 分 析出 两 
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点 校正 法 需要 的 两 个 关键 点 参数 。 利 用 得 出 的 关键 点 参数 ， 传 感 器 期 望 的 线性 行 
为 可 以 被 外 推 ， 其 他 位 于 运行 温度 范围 外 数据 点 的 温度 可 通过 式 (2.7) 计算 
出 。 一 项 工业 级 传 感 带 的 研究 表明 ， 为 了 获取 足够 多 的 样本 数据 ， 至 少 要 在 30 
个 传 感 右 进行 三 点 法 测量 采样 .”]。 对 每 个 独立 传感器 三 点 测量 值 进行 归纳 分 
析 ， 获 得 一 套 斜率 和 纵 坐 标 交 叉 点 数值 。 接 下 来 对 这 一 套 斜 率 和 交叉 点 数值 取 平 
均值 ， 总 结 出 具有 代表 性 的 线性 公式 。 
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图 2.17 传感器 校正 法 说 明 图 
a) 三 点 测量 分 段 线性 拟 合 b) 三 点 测量 直接 线性 拟 合 c) 两 点 测量 线性 拟 合 

为 了 减 小 测量 投入 ， 有 时 单 点 校正 也 会 被 考虑 ， 并 被 用 到 一 些 特定 的 传感器 
Bei pH? 80-82) 。 具 有 争议 的 是 ， 对 于 特定 的 传感器 设计 ， 传 感 器 的 响应 曲线 会 
被 分 成 两 个 独立 函数 : 一 个 涉及 温度 依赖 参数 ; 另 一 个 涉及 工艺 变化 依赖 参数 。 
假如 测量 结果 能 够 表明 ， 传 感 器 只 对 温度 依赖 参数 的 响应 ， 而 在 很 大 程度 上 对 工 
艺 变 化 参数 免疫 ， 则 单 点 校正 法 是 可 行 的 。 通 常情 况 下 ， 对 于 输出 电压 /电流 的 
elg ME ri, ， 通 过 极 少 测量 点 进行 校正 在 正常 情况 下 能 产生 可 接受 的 精度 ; 但 是 
对 于 时 域 传 感 器 而 言 ， 通 过 单 点 和 两 点 法 进行 校正 则 无 法 获得 可 接受 的 精度 。 


2.6 通过 系统 布局 提高 温度 测量 精度 


精度 是 温度 测量 的 关键 参数 ， 如 果 测 量 精度 较 差 .会 导致 测量 温度 偏 高 或 偏 
低 。 测 量 温度 偏 高 会 导致 热 控 制 机 制 (如 动态 电压 调整 以 及 频率 调整 ， 不 必要 
的 激活 ， 从 而 会 对 系统 性 能 产生 负面 影响 。 男 一 方面 ， 随 着 温度 的 增加 ， 平 均 失 
效 时 间 也 会 呈 指 数 级 地 下 降 。 同 时 其 他 电路 参数 也 会 受到 温度 升 高 的 影响 ， 如 前 
面 2. 1 节 讨 论 的 。 测 量 温度 偏 低 也 不 是 人 们 所 需要 的 ， 如 果 测 量 温 度 偏 低 ， 尽 管 
读 值 所 显示 的 芯片 运行 温度 低 于 其 标 称 的 温度 限 值 ， 但 是 芯片 实际 运行 温度 可 能 
已 经 比 它 标 称 温 度 限 值 更 高 ， 芯 片 可 靠 性 会 大 幅度 降低 。 

温度 传感器 较 理 想 的 分 配方 式 是 找 出 明确 定义 的 每 种 芯片 应 用 场景 下 的 最 热 
区 域 ， 在 每 个 最 热 区域 放 置 一 个 温度 传感器 。 早 期 尝试 在 微 处 理 器 上 建立 动态 温 
度 测量 的 方法 采用 了 类 似 的 原理 。 例 如 ， 在 英特尔 Pentium4 人 处理 带 中 ， 在 快速 
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整数 算术 逻辑 单元 (ALU) BRE Me eat, R R A BY fie E TE Ae E 
ALE sp AA E 90nm 的 英特尔 Itanium 双核 处 理 器 ， 采 用 了 4 
个 集成 在 必 片 结 上 的 传感器 ， 这 些 传感器 被 分 别 放置 每 个 核 的 整数 单元 和 浮 点 单 
元 附近 [ 引 。 虽 然 这 种 放置 方式 具有 一 定 优势 ,但 是 这 种 测量 方法 会 产生 很 大 的 
不 精准 度 。 高 功率 密度 芯片 (如 微 处 理 器 ) 的 温度 特性 会 受到 各 种 因素 影响 ， 
例如 处 理 器 上 的 局 部 加 热 就 是 一 个 与 应 用 相关 的 影响 因素 。 另 外 ， 工 艺 变化 会 直 
接 影 响 漏电 电流 顺 件 ， 从 而 进一步 影响 整个 芯片 的 功 耗 ， 因 此 即使 同一 批 制造 的 
芯片 的 温度 特性 也 会 不 一 样 。 功 耗 管理 技术 如 局 部 时 钟 门 控 技 术 和 任务 迁移 技 
R, 会 进一步 加 剧 同一 颗 蕊 片上 不 同 区 域 功率 密度 不 一 致 的 现象 。 男 一 个 重要 的 
影响 因素 是 传感器 位 置 到 芯片 内 产生 热 事 件 位 置 的 物理 距离 。 这 也 是 造成 关注 的 
热点 与 传感器 之 间 产 生 最 大 温度 梯度 的 可 能 因素 。 温 度 传 感 需 被 放置 在 距 关注 的 
热点 一 定 距 离 处 ， 如 果 关 注 的 热点 位 置 超出 传感器 能 够 侦 测 的 区 域 ， 传 感 融 的 读 
值 将 不 能 代表 热点 的 温度 状态 。 一 项 研究 表明 ， 传 感 器 到 温度 热点 的 距离 与 实际 
测量 温度 之 间 是 呈 指 数 关系 的 ， 式 (2.8) 为 两 者 之 间 的 计算 公式 [231 。 假 如 传 
感 需 物理 位 置 和 热点 位 置 之 间 的 距离 用 > 表示， 则 传 感 融 接收 到 的 热点 温度 可 以 
通过 下 式 进行 计算 : 


Ne Ve e] (2. 8) 

换 名 话说， 传感器 远离 热点 时 ， 测 量 的 温度 值 会 比 热 点 的 实际 温度 低 。 如 果 
此 时 传感器 刚好 位 于 芯片 内 最 热 的 点 处 ， 则 传感器 的 读 值 完全 代表 芯片 的 温度 特 
性 ， 这 是 一 个 特别 需要 注意 的 地 方 。 稼 系数 开 是 构成 芯片 的 每 个 物理 层 的 有 效 
热 阻 及 其 厚度 的 函数 ， 如 硅 品 元 、 热 扩展 板 、 散 热 器 等 。 对 于 有 多 个 热源 而 且 每 
个 热源 有 各 自 对 应 的 热点 情况 ， 可 以 预计 每 一 个 热点 与 传感器 之 间 的 温度 梯度 会 
对 整个 系统 产生 县 加 影响 。 在 这 种 情况 下 ， 近 似 估 计 将 会 不 准确 。 

由 于 上 述 精 确 测量 热点 温度 的 挑战 ， 所 以 一 些 研究 会 着 重 分 析 传 感 器 分 布 特 
性 。 令 人 感 兴趣 的 是 ， 即 使 一 些 则 在 识别 出 微 处 理 器 芯片 热点 区 域 的 相同 的 研究 
实验 ， 却 得 出 了 很 多 不 同 的 结论 。 在 早期 的 处 理 器 中 ， 考 虑 到 整数 处 理 单元 和 浮 
点 处 理 单 元 是 最 可 能 引起 热点 的 区 域 ， 一 些 传感器 会 被 放置 在 它们 附近 。 对 于 
Alpha 21364 架构 ， 大 量 的 SPEC CPU2000 9^! 基准 程序 测试 [5] 表 明 寄 存 器 堆 是 芯 
片 内 最 热 的 器 件 。 而 在 另 一 项 研究 中 ， 即 使 采用 了 相同 的 基本 架构 (在 配置 上 
会 略微 不 同 ， 主 要 差别 是 采用 了 不 同 配置 的 分 级 存储 体系 ， 特 别 是 二 级 缓存 
块 ) 、 基 准 程序 测试 套件 和 热 模 拟 器 ， 却 得 出 了 完全 不 同 的 结论 185] 。 大 多 数 情 
DUE, IAZ] (Issue Queue, IntQ) 会 产生 最 热点 。 考 虑 到 在 商业 产品 中 需要 
内 置 大 量 的 温度 传感器 以 及 前 面 报道 的 实验 结论 (温度 特性 是 与 架构 以 及 工作 负 
载 情况 息息相关 的 ) ， 因 此 在 架构 配置 、 工 作 负载 以 及 其 他 相关 设计 参数 和 系统 级 
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参数 一 定 的 情况 下 ， 需 要 人 们 从 系统 的 角度 来 考虑 传感器 的 分 配 和 放置 问题 。 

为 了 提高 测量 精度 ， 人 们 自然 会 想到 的 一 个 做 法 是 在 必 片 结 上 放置 非常 多 的 
温度 传感器 。 但 是 正如 在 前 面 几 个 章节 对 一 些 参数 探讨 的 ， 这 种 方法 会 显著 增加 
必 片 面积 、 功 耗 和 测试 成 本 。 在 两 种 不 同类 型 传感器 〈 模 拟 和 数字 型 ) 之 间 进 
行 选择 时 ， 需 要 权衡 考虑 ， 数字 传感器 通常 会 要 求 较 多 的 硬件 投入 ; 而 模拟 传 感 
器 由 于 本 身 回 有 人 缺陷， 扩容 能 力 较 差 ， 无 法 跟 上 越 来 越 低 的 供电 电压 发 展 趋势 以 
及 在 深 扩 度 处 理 需 单元 上 日 益 加 剧 的 工艺 变化 趋势 ， 对 这 些 因素 的 补偿 反 过 来 会 
导致 较 高 的 模拟 传感器 制造 和 测试 成 本 。 更 重要 的 是 ， 温 度 传 感 器 需要 专门 的 接 
口 和 通信 媒介 ， 如 集成 电路 总 线 CPC). PIRRO (SPD, 、 系 统管 理 总 线 
(SMBus) 或 者 忆 片 内 置 的 专用 网 络 ， 通 过 它们 可 实现 与 内 置 的 微 控制 器 、 非 内 
置 的 外 部 处 理 器 以 及 其 他 的 电子 系统 进行 通信 。 过 量 的 采用 传感器 不 仅 会 导致 占 
用 面积 的 急剧 增加 ， 而 且 将 大 量 的 传感器 测量 数据 传输 到 中 央 处 理 单元 也 是 一 个 
较 大 的 挑战 。 

上 述 的 这 些 问 题 ， 导 致 了 温度 传 感 咒 分配、 布置 系统 分 析 方法 的 发 展 。 其 中 
一 个 首次 提出 的 方案 定义 了 有 效 系 统 分 析 方 法 的 终极 目标 ， 即 在 保持 相对 合理 的 
投入 前 提 下 ， 找 出 能 获得 最 佳 测量 精度 的 温度 传感器 的 分 配 原则 以 及 物理 位 置 。 


2.6.1 通过 内 差 法 强化 均匀 网 格 


为 了 实现 传感器 架构 不 受 工 作 负载 的 影响 ， 一 个 较 好 的 方法 是 将 芯片 划分 成 
者 干 等 面积 的 均匀 网 格 ， 在 每 个 网 格 内 放置 一 个 温度 传感器 。 所 有 的 传感器 将 同 
时 进行 采样 ， 它 们 中 最 大 的 测量 值 将 被 用 于 计算 忆 片 的 核 温 。 假 如 网 格 的 尺寸 和 
温度 传感器 有 效 的 测量 半径 相等 ， 由 于 每 个 网 络 内 都 有 一 个 专门 的 传感器 ， 则 可 
以 预计 测量 精度 将 会 是 100% 。 但 是 ， 导 入 这 种 精细 化 的 传 感 融 网 格 是 不 切实 际 
的 。 每 增加 一 个 传 感 带 都 会 带 来 成 本 的 增加 ， 且 随 着 传 感 带 数量 的 增加 ， 增 加 的 
整 成 本 将 会 变 得 不 可 忽略 。 更 重要 的 是 ， 高 度 优化 过 的 处 理 融 芯片 电路 布局 通常 
只 保留 非常 有 限 的 空白 面积 ， 随 着 传感器 数量 的 增加 ， 传 感 融 的 布置 将 会 变 得 越 
来 越 复 杂 。 

因此 ， 静 态 传 感 吉 网 格 太 二 需要 被 限制 ， 同 时 还 需要 引入 一 种 算法 去 评 佑 受 
限 后 静态 网 格 的 测量 精度 。 下 面 这 些 关 键 参数 ， 对 静态 传感器 网 格 的 特性 有 很 大 
的 影响 。 首 先 ， 通过 静态 网 格 布置 方式 获得 的 测量 精度 同 传 感 带 的 数量 有 很 大 关 
系 ， 而 且 它 们 之 间 的 关系 是 非 线 性 的 。 

如 图 2. 18 所 示 ， 在 一 个 单 核 处 理 器 芯片 内 ， 温 度 测量 精度 随 放 置 在 规则 网 
格 中 传 感 需 数量 变化 的 趋势 ， 该 单 核 处 理 顺 芯片 主要 执行 SPEC 2000 套件 代表 性 
的 基准 程序 运算 。 可 以 看 出 ， 当 传感器 网 格 数量 增加 到 25 个 以 上 时 (注意 图 中 
x 轴 为 对 数 结果 ) ， 传 感 需 测量 误差 将 不 再 变化 。 需 要 重点 指出 的 是 ， 尽 管 对 于 
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其 中 的 一 些 应 用 ， 最 高 测量 温度 的 误差 会 非常 快速 地 降下 来 变 成 平滑 曲线 ; 但 是 
对 于 另外 一 些 应 用 ,测量 误差 仍然 非常 大 ， 如 gaigel 的 基准 程序 测试 。 尽 管 在 忆 
片 核 内 的 一 个 8 x8 的 网 格 上 放置 64 个 传感器 ， 最 大 测量 误差 也 可 能 有 5% 。 考 
虑 到 传感器 的 读 值 会 用 于 DTM (动态 热管 理 ) 以 及 热 突 发 事件 管理 ，5Y 的 测量 
误差 会 导致 不 必要 的 降 频 或 者 将 芯片 带 到 危险 的 境地 。 总 结 出 的 结论 为 : 在 一 些 
应 用 场景 下 ， 调 整 网 格 的 矿 才 可 以 提高 传 感 顺 架构 的 测量 有 效 性 ， 但 是 在 另外 一 
些 应 用 场景 下 ， 由 于 热点 被 过 于 简单 的 定位 ， 以 至 于 即使 采用 精细 化 的 传感器 网 
格 ， 也 无 法 侦 测 到 发 生 显著 热 事件 的 位 置 。 


传感器 数量 对 数 (lgN) 


图 2.18 处 理 器 核 内置 的 传感器 数量 与 最 差 温度 测量 误差 之 间 的 关系 图 。x HE 
传感器 数量 的 对 数 结果 ; SPEC 2000 套件 的 六 种 不 同 基准 测试 被 分 析 


由 于 上 述 的 静态 网 格 布置 没有 尝试 去 优化 传感器 到 热点 的 距离 ， 因 此 基本 均 
匀 网 格 不 可 避免 地 存在 测量 精度 不 一 致 的 现象 ， 以 及 会 导致 产生 大 测量 误差 的 潜 
在 风险 。 因 此 ， 对 于 均匀 网 格 而 言 ， 还 需要 通过 修正 的 方法 来 进一步 优化 它们 的 
温度 读 值 。 基 本 的 思路 是 通过 对 若干 传感器 的 温度 读 值 进行 内 差 ， 计 算 尽 片 内 远 
离 传感器 的 位 置 点 的 温度 。 因 此 在 热 测 量 系统 中 不 会 将 传感器 的 读 值 直 接 作 为 芯 
片 热点 温度 ， 而 是 采用 对 热点 附近 区 域内 若干 传感器 读 值 进行 内 差 ， 然 后 通过 内 
差 法 更 加 准确 地 计算 出 芯片 内 最 高 温度 。 

人 们 提出 一 种 利用 网 格 传感器 读 值 进行 内 差 法 的 方案 ， 用 于 估计 多 核 
(CMP) 芯片 的 热点 温度 !9] 。 每 个 传感器 及 其 临近 区 域 传感器 的 温度 值 都 被 读 
取 ， 进 而 用 于 计算 传感器 附近 区 域 热点 的 位 置 和 温度 。 传 感 器 5; 的 临近 区 域 被 
定义 为 VCSi) : 


(2.9) 


2 2 ”2 2 
SU, Gg. y). 为 给 定 温度 传感器 Si 的 x — y 坐标 数值 ; r, 为 两 个 相 邻 传感器 之 
间 的 距离 。 临 近 区 域 的 定义 为 : MERA SAU, r, 为 半径 圆 的 外 切 正方 形 区 
域 。 如 图 2. 19 所 示 ，54 的 临近 区 域 是 以 8 为 中 心 点 ， 往 外 延伸 产生 的 虚线 正方 


X; —r, X; tr Yi TT, PTT, 
NGO | Gl — PES d Syst | 
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形 区 域 。 虚 线 正 方形 四 条 边 分 别 延 伸 到 $4 与 每 个 直接 相 邻 点 5S1 、S3、Ss 和 S; E 
线 的 中 心 点 处 为 止 。 一 旦 每 个 传感器 的 临近 区 域内 最 大 温度 数值 被 计算 出 来 ， 它 
们 之 间 的 最 大 值 将 被 用 作 峰 值 温度 。 

对 于 图 2. 19 描述 的 邻近 区 域 ， 我 们 首 o! 
先 来 考虑 沿 x 方向 的 温度 特性 。 假 如 5; 的 
读 值 大 于 S 和 S, 的 读 值 ， 则 临近 区 域 
N (5 ) 的 最 热点 位 置 应 该 接近 S4 All 5; 中 心 
点 。 尤 其 当 SUI 5; 之 间 温 度 曲 线 的 梯度 不 
变 时 ， 最 热点 的 x 坐标 位 置 应 该 为 x + rs/ 
2。 相 似 地 ， 如 果 5; 的 读 值 大 于 54 和 5; 的 讯 
值 ， 则 临近 区 域 (S,) 内 最 热点 的 x 坐标 C 
位 置 应 该 为 x -r /2。 如 果 5 的 读 值 大 于 S, 图 2.19 内 差 法 计算 的 传感器 的 
和 5S; 的 读 值 ， 则 (S, -S5) 和 (S, - Ss) 邻近 区 域 示意 图 
之 间 的 温度 梯度 都 可 以 被 用 来 估算 最 热点 
位 置 。 上 述 的 估算 方法 假定 分 制 区 域内 最 热点 及 其 最 相 邻 传感器 之 间 的 温度 梯度 
是 固定 值 ， 因 此 分 割 区 域内 的 温度 可 以 被 近似 为 * 和 y 坐标 的 线性 函数 。 假 定 


$3、S4、5; 的 实际 温度 读 值 分 别 为 TZ 、7T4、7Ts ， 则 临近 区 域 W 〈S4) 内 最 热点 的 
_ AT, - AT. 
x 坐标 值 应 为 x, + 2 23 >> , EP AT, 2T,-T,, AT; =T, - T,, 


2 AT, + AT," 

对 于 yy 坐标 值 的 估算 可 采用 相似 的 方法 。 一 般 情况 下 ， 临 近 区 域 N(S,) 内 
最 热点 的 坐标 可 以 通过 式 (2.9) 和 式 (2. 10) 进行 估计 。 接 下 来 ， 最 热点 的 坐 
标 将 被 转化 成 最 热点 及 其 最 临近 传 感 带 构成 分 割 区 域 的 温度 的 函数 。 式 (2. 12) 
WX (2.13) 为 转化 计算 公式 ， 通 过 公式 可 以 算出 最 高 温度 值 。 


1 AT, + AT, ie. mu 
2 AT, + AT,” 47 max (T; ,T; ) 
Ax = -in "m T, =max (T4,T;) 
1 
dis a T, =max (7T,,T,) 
1 AT, -AT, m Rm 
2 AT, +AT, 427 max ( 75* 1) 
Ax = - Fr, PASE AR PA KS SE AE RS T, Z max (T,,T;) 
1 
E a TEOSA T max (T, T.) 


(2. 10) 
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(%est Yes) = (x4 + Ax,ya + Ay) (2. 11) 
IAS = AT, (AT AT) T, max (Ts, 15) 
AT, + AT, 59 3 4 5973 
AT, = (T T.) 
max , 
X ees -— "eR T, S max (7; ,7;) 
JA AT ax (AT, AT, ) T, > max (75571) 
AT, + AT, F3 1 4 Tol 
iie (2.12) 
° max (T;,T,) 
"I ux ^ ——Á— n ee T, Smax (T;,T,) 
TN(s,) 7 Ta + AT, + AT, (2.13) 


X (2.10) ~ 式 (2.13) 的 推 


为 常数 的 假设 。 但 是 


导 是 基于 $4 和 估计 的 最 热点 之 间 温 度 曲 线 梯度 


该 假设 在 实际 应 用 的 芯片 中 是 不 可 行 的 。 ee 


点 附近 ， 温 度 梯 度 变 化 会 很 剧烈 。 因 此 ， 如 果 直 接 采 用 这 些 等 式 进行 推导 ， 峰 值 
点 的 温度 将 会 被 过 高 地 估算 。 需 通过 式 (2.14) MÈ (2.15) 对 式 (2 10) ~ 
式 (2.13) 进行 修正 。 
AT. - AT; | 
Kap gar, ICAT , AT, )…… T, > max (T;,T4) 
AT, - M T (2.14) 
B OT g) u— — T, € max (T, ,T,) 
AT, =A7, | 
K Ar aap, (4AT AT) anaes T, > max (T;,T;) 
AT, = : "n (2.15) 
ge Get) gs —— T, Smax (T; ,T, ) 
X (2.14) 和 式 (2.15) 用 到 的 系数 k 的 物理 含义 ， 可 以 通过 图 2. 20a HR 


R. KT > 时 ， 系 数 « 为 v4 和 x 之 间 的 平均 温度 梯度 除 以 x 和 平均 温度 梯 
E (C T >7T; 时 ， 则 系数 «为 wy 和 x 之 间 的 平均 温度 梯度 除 以 xs 和 x 平均 温 
度 梯度 ) 。 关 于 系数 B 的 物理 解释 ， 采取 类 似 的 方法 。 

如 果 芯 片 热 各 向 同性 的 假设 成 立 ， 则 x 和 y 方 向 可 以 采用 相同 的 x« 和 B。 通 
常情 况 下 ， 估 算 < ANB 的 数值 大 小 非常 困难 ， 因 为 很 难 找到 一 个 遵从 温度 -距离 
曲线 的 准确 计算 公式 。 但 是 通过 图 2. 20 可 以 看 出 ， 在 接近 最 高 点 处 的 温度 曲线 
梯度 快速 的 接近 于 0， 因 此 系数 k 应 该 很 小 且 接近 于 0。 同样 地 ， 因 为 x 和 和 允 之 
间 的 均 温 度 梯度 基本 不 变 , B 的 数值 应 该 接近 于 1。 尽管 x 和 8p 是 传感器 坐标 
(xi, y) 以 及 传感器 到 热 事 件 发 生 点 之 间距 离 r 的 复杂 函数 ， 而 且 它 们 同 架 构 
也 有 很 大 关系 ,但 是 通过 实验 发 现 当 k =0. 83/ VN AA B =0.93 时 估算 误差 

最 小 (Now 是 分 配 到 每 个 核 上 的 传感器 数量 ) 。 
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a) b) 
图 2.20 系数 «和 8B 的 物理 描述 


基于 上 述 内 差 法 方案 ， 一 种 称 为 基于 内 差 动 态 传感器 的 选择 法 被 提出 ， 并 用 
于 传感器 管理 [5%] 。 它 主要 用 于 协调 芯片 内 需要 内 置 大 量 传感器 与 期 望 运行 消耗 
较 少 之 间 的 矛盾 。 尽 管 在 每 个 核 内 可 以 内 置 大 量 的 温度 传感器 ， 但 是 在 一 个 给 定 
的 瞬间 ， 热 监控 单元 只 能 接收 少量 的 传感器 读 值 。 因 此 ， 人 们 产生 了 对 温度 传 感 
器 进行 分 层 管理 的 思路 。 首 先 只 激活 粗 粒 度 传感器 ， 并 利用 它们 的 读 值 通过 内 差 
法 估算 出 芯片 核 内 的 热点 位 置 。 同 时 ， 其 他 的 传感器 及 其 支持 电路 被 置 于 待机 / 
睡眠 状态 。 接 下 来 ， 最 靠近 估算 热点 位 置 的 网 络 传感器 会 被 激活 。 由 于 估算 的 最 
热点 位 置 可 能 不 准确 ， 为 了 进一步 优化 测量 精度 ， 最 靠近 热点 的 传 感 需 周围 的 其 
AR 8 个 传感器 也 会 被 激活 。9 个 传感器 的 最 大 读 值 ， 将 用 于 重新 估算 核 内 热点 温 
度 。 与 间接 计算 热点 温度 方法 相 比 ， 直 接 利用 传感器 网 格 读 值 来 获取 热点 温度 能 
更 好 地 适应 于 各 种 不 同 的 架构 。 

图 2.21 描述 了 上 述 方案 。 图 中 首先 假定 网 格 传 感 融 总 数量 为 64 个 (图 中 只 
显示 了 部 分 传感器 ) 。 必 片 被 划分 为 16 个 同 尺 寸 的 1/4 圆 ， 每 个 圆 的 中 心 处 布置 
一 个 温度 传 感 顺 ， 传 感 器 用 So ~ Si 表示， 它们 作为 粗 颗粒 传 感 顺 使 用 。 第 一 步 ， 
首先 激活 这 些 粗 颗粒 传感器 ， 并 将 它们 的 读 值 代入 式 (2.10) 和 式 (2.11) fih 
算 热点 位 置 。 如 图 2. 21a 所 示 估 算出 的 热点 位 置 会 被 标记 成 星 号 。 第 二 步 ， 如 图 
2.21b 所 示 ， 最 靠近 估算 热点 位 置 的 网 格 传感器 及 其 附近 的 其 余 8 个 网 格 传感器 
将 被 激活 。9 个 激活 后 的 传感器 的 最 大 读 值 将 直接 用 于 热点 温度 。 示 例 中 ， 一 共 
有 25 个 传感器 被 激活 (16 个 粗 颗粒 传感器 加 9 个 第 二 步 中 激活 的 网 格 传感器 ) 。 
将 上 述 内 差 法 用 在 两 种 CMP 架构 中 进行 测试 。 如 图 2. 22 Bros HG Fr ERU 
放置 方式 ，CMP 架构 被 划分 为 细密 度 架构 和 粗 密度 架构 。 细 密度 架构 在 平面 方 
向 上 将 全 部 核 紧 紧 地 布置 在 一 起 ， 而 所 有 的 缓存 被 放置 在 核 四 周 ; 而 粗 密度 架构 
则 在 核 与 核 之 间 保 留 一 定 的 空白 区 域 ， 用 于 放置 二 级 缓存 器 。 很 明显 ， 细 密度 架 
构 的 热 载荷 更 大 ， 温 度 将 会 更 高 。 
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基于 内 差 动 态 传感器 选择 法 步 又 图 


芯片 内 置 温度 侦 测 
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最 近 的 网 络 传感器 


b) 


F 粗 颗粒 传感器 读 值 估算 出 热点 位 置 


b) 最 接近 热点 位 置 的 网 格 传感器 及 其 附近 8 个 网 格 传感器 被 激活 
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a) b) 
图 2.22 44% (CMP) 芯片 的 平面 图 
a) 细密 度 架构 ， 二 级 缓存 放置 在 核 序列 周边 
b) 粗 密度 架构 ， 二 级 缓存 被 分 别 放置 到 两 个 传感器 之 间 


onn 


粗 密度 芯片 的 网 格 尺 寸 为 312 x312, 
通过 稳 态 分 析 法 计算 出 每 


个 起 片 初始 》 


日 密 度 芯 片 的 网 格 尺寸 为 288 x 288, 


d RR eie 
B 


温度 数值 用 于 后 续 的 瞬 


态 分 析 。 初 始 阶 段 即 为 芯片 的 预 加 热 阶 段 ， 环 境 温 度 设 为 40% ， 后 续 的 瞬 态 分 


析 时 间隔 被 设 为 0. 05s， 
它 的 每 个 采样 周期 包括 1. 25 x 10 个 循环 ， 


片 为 例 ， 


每 个 时 间 间 隔 为 一 


个 计算 步 长 。 以 2. 5GHz 的 时 钟 频 芯 
一 个 采样 周期 即 为 一 个 瞬 态 
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分 析 步 长 。 整 个 热 仿 真 分 析 持 续 15 个 步 长 ， 即 包括 1.75 x 10" 个 循环 。 前 一 个 迭 
代 计 算 的 最 终 温 度 ， 将 会 作为 下 一 个 迭代 的 初始 温度 值 。 当 任 一 个 核 的 最 高 温度 
超过 了 温度 阔 值 时 (本 实验 中 设置 为 82%C ) ， 通 过 一 个 不 断 地 扫描 芯片 的 动态 电 
压 和 频率 的 模型 ， 世 片 将 会 被 降 频 。 功 耗 模拟 器 的 动态 功 耗 输 出 值 ， 也 会 相应 地 
被 扫描 。 基 于 扫描 的 动态 功 耗 数值 ， 芯 片 的 温度 和 漏电 功 耗 会 一 直通 过 迭代 循环 
的 方法 进行 计算 ， 直 到 漏电 功 耗 收 敛 为 止 。 通 过 该 研究 发 现 了 一 个 有 趣 的 现象 : 
如 果 两 种 架构 下 每 个 核 的 传 感 融 数 量 一 样 ， 妆 采用 内 差 法 计算 时 ， 细 密度 架构 和 
粗 密 度 架 构 下 的 测量 误差 相差 不 大 。 因 此 ， 内 差 法 具有 很 强 的 适应 性 。 男 一 个 得 
出 的 结论 是 ， 在 数据 采集 过 程 中 ， 同 静态 均匀 网 格 的 方法 相 比 ， 如 果 采 用 基于 上 
述 动态 传感器 选择 的 方法 ， 可 以 在 保证 相似 测量 精度 的 前 提 下 ， 大 量 减少 使 用 的 
传 感 噩 数量。 例如， 对 于 上 述 两 种 架构 ， 如 果 只 激活 36 “Mea PAY 18 个 , 动 
态 传 感 吉 选择 法 产生 的 测量 精度 ， 以 及 侦 测 一 个 静态 6 x6 网 格 内 的 热 突 发 事件 
成 功率 ， 同 全 部 激活 36 个 传感器 的 静态 均匀 网 格 法 基本 一 致 。 


2.6.2 非 均 匀 网 格 传感器 的 分 配 与 布置 


静态 均匀 网 格 的 替代 方法 是 利用 目标 应 用 区 域内 的 特征 信息 来 设计 定制 一 个 
非 均 匀 传 感 器 的 分 配 和 布置 法 。 而 更 直接 的 方法 是 ， 通 过 仿真 来 侦 测 潜在 的 热 
点 ， 然 后 在 每 个 热点 附近 放置 一 个 传感器 。 在 实际 应 用 中 ， 这 种 方法 会 有 一 些 问 
题 。 首 先 ， 热 点 的 位 置 与 应 用 场景 有 很 大 关系 ， 其 中 一 种 应 用 场景 下 得 出 的 最 佳 
传感器 位 置 不 一 定 适 应 于 其 他 应 用 场景 。 第 二 ， 针 对 所 有 的 应 用 场景 ， 假 如 可 以 
通过 大 量 充 分 的 基准 实验 分 析出 所 有 可 能 的 热点 位 置 ， 则 总 的 热点 位 置 将 非常 
多 ， 布 置 的 传感器 数量 会 非常 停 人 。 

因此 ， 很 有 必要 去 开发 一 种 自动 化 方法 去 确定 传感器 的 最 佳 放置 位 置 。 人 们 
提出 的 旨 在 解决 该 问题 的 第 一 个 系统 化 方案 ， 按 照 下 述 两 步 进行 [5] : 第 一 步 ， 
对 一 个 众多 的 应 用 场景 ， 对 全 部 热点 生成 一 个 全 位 置 图 。 接 下 来 ， 在 空间 区 域内 
将 问题 归纳 为 由 感 兴趣 点 构成 的 篮 函 数 。 复 的 数量 通过 可 用 的 传感器 数量 确定 ， 
或 者 通过 尝试 传感器 分 配 预 算 范围 内 的 迭代 过 程 来 优化 。 每 个 簇 的 中 心 ， 即 为 传 
感 器 的 物理 位 置 。 该 传感器 将 被 用 来 测量 同 艇 内 的 兴趣 点 的 温度 。 因 此 ， 传 感 器 
的 温度 代表 了 相应 的 覆盖 区 域 的 温度 。 每 个 传感器 的 读 值 误 差 ， 都 可 以 通过 艇 中 
心 点 同 簇 内 其 他 点 之 间 的 距离 表示 。 因 此 ， 减 小 整个 系统 测量 误差 的 问题 ， 转 化 
为 天 均值 聚 类 算法 变量 的 函数 [ss,89] 。 
2.6.2.1 天 均值 聚 类 算法 基本 原理 

基本 大 均值 聚 类 技术 方案 ， 按 照 如 下 进行 定义 ， 

给 定 一 个 输入 的 整数 不 值 和 一 套 包 括 了 个 数据 点 及 = [a/(xa, xa. oc 
xa). i=1, 2, +, n] 的 数据 库 ， 每 个 点 的 尺 都 通过 mm AES TEL BO Ab Ea, 
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来 表示 。 确 定 了 下 个 中 心 点 ， 这 就 意味 着 每 个 数据 点 到 其 最 近 中心 点 的 均 方 差距 
离 为 最 小 ， 即 


Minimize 之 ”) las B [5 
式 中 ,代表 到 数据 结 点 @ 最 近 的 簇 中 心 。 

大 均值 聚 类 算法 的 原理 为 : 通过 不 断 迭 代 来 优化 个 簇 中 心 点 位 置 。 初始 
时 ， 从 工 个 数据 点 中 随机 选取 作为 大 个 复 中 心 的 位 置 。 然 后 ， 每 个 数据 点 找 出 离 
它 最 近 的 篮 中 心 。 按 照 这 样 的 方式 ， 每 个 复 中 心 都 将 会 拥有 数 个 数据 点 。 接 下 
来 ， 将 簇 中 心 点 移动 到 它 拥 有 的 全 部 数据 点 的 中 心 点 处 ， 完 成 一 次 迭代 过 程 。 持 
BIER BIR ASEM TTR 

ZEA k SARE FE A AR RBA a BE, AA IE Ua HER eK AC 
ABV), AUER UR AoE IM TRE. 293—748, ROA A BRU LA 
可 以 将 于 个 数据 点 划分 到 天 个 复 中 。 因 此 ， 算 法 最 终 都 会 收敛 结束 。 通 过 对 迭代 
步 数 的 上 限 值 或 通过 对 目标 函数 中 需要 实现 的 渐进 提高 结果 设置 一 个 上 限 值 ， 可 
以 提前 终止 迭代 计算 。 

但 是 ， 如 果 提 前 终止 算法 ,无 法 保证 有 均值 聚 类 壕 代 计 算 获 得 最 佳 计 算 结 
果 [%1。 因 此 ， 在 初始 随机 选取 簇 类 时 ， 必 须要 应 用 一 些 技巧 。 一 个 行 之 有 效 方 
法 是 在 尽 可 能 远离 1 到 7 -1 个 中 心 的 数据 点 中 ， 放 置 第 7 个 初始 中 心 [%] 。 该 温 
度 传感器 布置 方法 的 主要 目的 是 创造 上 个 温度 传 感 句 (个 复 中 心 ) 去 监控 nn 个 
热点 温度 ， 复 中 心 为 相应 的 传感器 位 置 点 。 通 过 放置 在 每 个 篮 中 心 的 传感器 ,来 
监控 每 个 复 内 数据 点 的 温度 ， 每 个 篮 内 数据 点 即 为 相应 的 热点 。 
2.6.2.2 温度 梯度 感知 (TCA) k ERX 

基于 上 均值 聚 类 算法 需要 关联 传感器 的 测量 误差 同 传感器 与 热点 之 间 的 距 
离 。 热 点 附近 的 温度 梯度 与 热点 温度 呈 线 性 关系 。 因 此 ,假如 有 一 个 最 高 温度 为 
370K 的 热点 和 另外 一 个 最 高 可 能 温度 为 350K 的 热点 ， 基 本 均值 算法 将 会 在 两 
个 热点 中 间 放 置 传感器 。 但 是 ， 由 于 高 温 点 附近 的 温度 梯度 大 于 低温 点 附近 的 温 
度 梯度 ， 因 此 如 果 将 传感器 位 置 朝 370K 的 高 温度 点 挪动 ， 这 将 会 对 测量 精度 提 
高 有 利 。 所 以 ， 较 好 的 传 感 需 分 配方 案 应 该 重点 考虑 通过 热点 温度 来 减 小 实际 的 
加 权 距 离 ， 而 不 是 减 小 实际 的 物理 距离 。 一 种 基于 TGA 大 均 值 聚 类 和 传感器 分 
配 的 算法 可 用 于 解决 此 问题 。 

考虑 热 特 征 7 了 为 热点 温度 函数 ， 每 个 热点 的 特征 为 3 维 空间 分 布 ， 可 通过 组 
合 (x, y, T) 进行 表征 。 因 此 ,温度 梯 度 感知 传感器 的 分 配 算法 可 按 以 下 两 步 
进行 : 第 一 步 ， 将 热点 分 成 若干 个 篮 类 ， 同 一 个 复 类 内 的 热点 将 呈现 出 同样 的 空 
间 和 温度 关联 性 ; 第 二 步 ， 识 别 出 每 个 复 内 需要 放置 传感器 的 物理 位 置 。 给 定 的 
复 内 任 一 热点 的 热 条 件 需 要 满足 : 在 热点 处 放置 传感器 时 ， 传 感 器 应 该 能 提供 最 
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可 靠 的 信息 。 如 果 将 传 感 顺 直接 放置 篮 中 心 处 ， 则 称 为 3D 放置 方案 ; 否则 , 将 
通过 后 面 讨论 的 启发 性 方案 确定 传 感 天 的 位 置 。 

除了 2 维 欧式 距离 需要 衍生 到 3 维 外 ，3 维 空间 内 簇 阶 段 的 迭代 同 2 维 空间 
内 基本 均值 迭代 相似 。 可 通过 下 式 找 出 每 个 热点 所 属 的 簇 中 心 ，; 

d(ij) 2 (x; -x))? + (yy) + (0 - Y? (2. 16) 
UP. Qu. y) 和 Gs, 94) DIDIHRGS RR Dub. CR. T) 表征 热点 和 
簇 中心 的 温度 水 平 。 

一 旦 热点 被 分 配 到 个 艇 中 ,温度 传 感 带 的 物理 位 置 也 随 之 被 确定 。 此 方法 
提出 了 与 前 述 不 同 的 方案 ,不 再 将 每 个 艇 的 中 心 作为 热点 位 置 ， 它 需要 考虑 入 内 
的 温度 梯度 。 其 基本 思路 为 : 将 簇 中 心 或 者 传 感 占 朝 高 温 热 点 方向 移动 。 相 当 于 
通过 一 个 较 大 的 力 ， 将 传感器 吸引 到 高 温度 热点 ， 其 算法 如 图 2. 23 所 示 。 


均 温 度 ， 通 过 一 个 吸引 系数 o 将 传 感 吉 位 置 天 热点 推动 ， 如 步骤 13 所 示 。 通 过 
实验 发 现 ， 当 吸引 系数 a 的 值 为 0. 1 时 效果 最 佳 。 通 过 步骤 1 ~ 18 的 迭代 计算 ， 
对 步 又 3 ~ 14 确定 的 簇 中 心 进行 不 断 优化 ， 热 点 到 簇 中 心 的 均 方 距离 会 被 不 断 缩 
小 。 注 意 用 这 种 方法 计算 复 中 心 时 ， 传 感 器 的 位 置 将 会 朝 温 度 梯度 最 大 的 方向 移 
动 。 需 要 注意 的 是 ， 尽 管 禾 中 心 的 温度 维度 被 用 于 距离 定义 ， 但 是 只 有 当 温 度 维 
度 用 于 模拟 朝 位 置 点 移动 时 ， 才 会 展现 出 较 大 的 热 应 力 。 传 感 器 物理 位 置 点 的 温 
度 决定 传感器 的 读 值 ， 它 与 篮 中 心 的 温度 坐标 T, 没有 直接 的 物理 关联 性 。 

最 后 ， 需 要 注意 的 是 n 维 篮 概 念 ， 它 允许 考虑 传感器 布置 中 用 到 的 其 他 参 
数 。 除 了 温度 梯度 外 ， 一 个 给 定 热点 的 发 生 频 率 也 是 另 一 指导 传感器 布置 的 重要 
参数 。 频 率 可 以 被 合并 作为 另外 一 个 维度 ， 用 来 定义 复 群 内 的 每 个 热 事 件 点 。 上 
面 强调 的 基本 算法 ， 可 以 按照 下 面 几 个 方法 进行 分 类 ?1 。 

全 局 传感器 分 配 法 : 此 策略 中 ,需要 考虑 全 局 (例如 整个 蕊 片 内 ) 热点 。 
全 局 热点 是 指 对 于 给 定 工作 负载 模式 下 ， 整 个 芯片 内 产生 绝对 温度 最 大 的 位 置 
点 。 在 一 定 的 架构 配置 条 件 下 ， 即 使 应 用 场景 不 同 ， 全 局 热点 通常 会 在 同一 个 功 
能 单元 重复 出 现 (但 是 同一 功能 单元 内 热点 的 位 置 可 能 改变 ) 。 然 而 ， 某 些 特殊 
原因 可 能 会 导致 全 局 热点 位 置 在 攻 片 内 部 不 同 器 件 上 移动 。 例 如 ， 在 一 个 超级 标 
量 处 理 器 芯片 内 ， 多 个 浮 点 单元 副本 可 以 被 有 选择 的 激活 。 在 只 有 一 个 浮 点 单元 
被 激活 的 时 间 间 隔 内 ， 该 浮 点 单元 会 产生 一 个 热点 。 而 在 另外 一 个 时 间 间 隔 内 ， 
当 该 单元 内 多 个 副本 被 激活 后 ， 工 作 负载 分 配 将 会 更 加 均匀 ， 此 区 域内 的 功率 密 
度 将 变 低 。 此 时 ， 其 他 单元 ( 如 指导 序列 ) 才 会 产生 热点 。 通 过 全 局 传感器 分 
配 策略 布置 的 传感器 ， 将 会 按照 下 面 步 又 来 抓 取 这 些 热 点 。 第 一 步 ， 初 始 布置 的 
多 个 传感器 被 估算 ， 并 且 基 于 这 些 传 感 吉 进行 TGA 传感器 分 配 算法 。 接 下 来 ， 
通过 和 迭 代 计 算 不 断 地 优化 传感器 的 分 配 ， 直 到 热 测 量 精 度 降 到 给 定 的 范围 内 。 一 
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个 好 的 初始 设置 ， 应 该 保证 传感器 的 数量 最 好 同 主要 单元 的 数量 相等 ， 然 后 再 增 
加 或 者 减少 传感器 数量 。 

局 部 传 感 融 分 配 法 : 此 方法 的 目的 是 为 每 个 独立 处 理 器 内 的 器 件 或 者 单元 确 
定 传感器 分 配方 案 。 依 据 此 算法 ， 每 个 器 件 的 热点 被 重新 定义 。 对 于 特定 器 件 而 
言 ， 热 点 即 为 特定 应 用 场景 下 单元 内 观察 到 的 最 高 温度 点 位 置 。 在 各 种 动态 优化 
方案 中 ， 有 效 的 局 部 监控 是 至 关 重 要 的 。 例 如 ， 可 以 通过 局 部 温度 监控 机 制 ， 来 
协助 活动 迁移 以 及 进行 危害 评估 。 局 部 器 件 的 温度 信息 可 以 被 动态 缓存 优化 使 
用 ， 用 于 降低 漏电 功 耗 :>-%]。 存 储 单元 内 的 峰值 温度 ， 通 常 和 一 些 其 他 单元 峰 
值 温度 不 一 样 高 ， 当 然 它 们 也 不 会 超过 安全 温度 阔 值 ， 从 而 导致 降 频 。 但 是 ， 静 
态 随 机 存储 器 (SRAM) 漏电 功 耗 同 内 存单 元 的 状态 也 有 很 大 关系 ， 即 使 相对 较 
小 的 温度 梯度 也 能 引起 的 漏电 功 耗 明显 增加 。 

对 于 局 部 传感器 分 配 ， 又 可 按照 以 下 类 别 进行 划分 : 

朴素 分 配 法 : 它 是 一 种 最 直接 的 方法 ， 在 每 个 处 理 器 单元 上 放置 固定 数量 的 
传感器 。 基 于 处 理 器 单元 的 几何 尺寸 和 对 齐 情况 ， 有 很 多 不 同 的 方法 来 布置 传 感 
器 。 其 主要 思路 是 通过 递归 均 分 将 处 理 器 单元 分 成 若干 较 小 的 子 单元 ， 直 到 子 单 
元 的 数量 和 准备 使 用 的 传感器 数量 相等 。 例 如 ， 如 果 只 有 一 个 传感器 ， 只 要 将 传 
感 器 放置 在 处 理 器 单元 的 几何 中 心 处 ;如 果 有 两 个 传感器 ， 则 需要 将 处 理 器 单元 
沿 其 长 度 方向 均 分 成 两 个 子 单元 ， 在 每 个 子 单元 的 中 心 处 各 放置 一 个 传感器 。 

TGA 权重 艇 中 心 (WCC) 内 单个 传感器 分 配 法 : 这 种 方法 的 目的 是 为 每 个 
子 器 件 放置 一 个 传感器 。 该 方法 相当 于 运用 如 图 2. 23 所 示 的 温度 梯度 感知 分 配 
法 ,但 是 不 需要 在 器 件 单元 内 进行 徐 划 分 。 此 方案 通过 整个 热点 图 来 构建 一 个 单 
一 徐 ， 簇 中 心 即 为 单个 传感器 的 布置 位 置 。 因 此 ， 此 方法 被 称 为 TGA WCC, € 
与 TGA 均值 聚 类 方法 相同 ， 但 是 使 用 的 左 值 为 1。 

TGA 分 配 法 : 当 准 备 在 每 个 处 理 器 内 单元 上 放置 多 个 传感器 时 ， 会 使 用 此 
方法 。 通 过 TOA k 均值 算法 实现 该 分 配方 法 ,为 每 个 单元 内 传感器 的 数量 ,， k 
个 复 内 中 心 即 为 大 个 传感器 的 位 置 。 随 测量 精度 增加 ， 传 感 器 的 数量 需要 相应 的 
增加 。 

混合 (HY) 传感器 分 配 法 : 同 前 面 提 到 的 所 有 单元 均 采 用 相同 数量 传感器 
的 方法 相 比 (无 论 是 WCC 单个 传感器 分 配方 法 还 是 固定 传感器 数量 的 TGA 分 配 
方法 ) HY 分 配 法 允许 在 不 同 的 单元 上 分 配 不 同 数量 的 传感器 。 通 过 不 同 单元 
内 观察 到 的 测量 误差 ， 来 决定 每 个 子 器 件 的 传感器 数量 。 首 先 ， 针 对 每 个 单元 ， 
通过 WCC 法 放置 单个 传感器 ， 相 应 地 确定 其 测量 精度 。 然 后 ， 根 据 每 个 独立 单 
元 内 观察 到 的 测量 精度 ， 不 断 地 运用 TCA 分 配 法 增加 传感器 数量 ， 直 到 该 单元 
内 的 测量 精度 不 再 明显 提高 为 止 。 针 对 不 同 的 单元 ， 依 据 它们 要 求 的 测量 精度 不 
同 ， 分 配 不 同 数量 的 传感器 ， 这 样 可 以 减少 传感器 总 的 数量 。 
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不 同 


Algorithm k-means clustering () 


Input : hof;,; [N] : array of hotspots locations 
cluster;,: [K] : array of sensor locations 
Output : member [N] : array of membership of hotspots 


0 Initialize cluster [K] to be K points in hot [N] 
1 WHILE 6/N > threshold 
2 5<0 
3 FOR i=0 TO N-1 
4 FOR j=0 TO K-1 
5 de |hot,y4[i] -clustery ysl] | 
6 IF d< dinin 
Yi d e- di, 
8 n cj 
9 IF member[i] nn 
6<64+1 
member[i] <n 
newsize[n] <-newsize[n]+1 
new_clustery y [n] € new cl uster, y [n] thot, y [i] 
+ a (new cluste ry y Ln] -hot, [1] ) 
x (hot[i(t)]-new cluster[n(t)]/newsize[n]) 
new cluster, [n] «- new, cluster, [n] «hot, [i] 
FOR j-0 TO K-1 
cluster, ,,[3] «- new cluster, ,,[3] /newsizelj] 
new, cluster, 03] <0 
newsize[j] < 0 


图 2. 23 用 于 优化 传感器 布置 的 天 均值 聚 类 算法 程序 代码 


图 2. 24 为 采用 上 均值 聚 类 算法 进行 传感器 布置 的 示例 。 图 2. 25 为 运用 三 种 
聚 类 算法 [2D (使 用 单 距离 度量 ) 3D (将 温度 作为 第 三 个 维度 ) TGA 
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2.24 在 一 个 代表 性 处 理 器 芯片 核 上 ， 通 过 热 模拟 分 析 不 同 工 作 负载 下 的 热点 位 置 ， 
从 而 获得 传感器 位 置 点 。 图 中 圆 点 代表 在 一 定 工作 负载 下 的 峰值 温度 点 ， 
三 角形 代表 通过 天 均值 聚 类 算法 求 出 的 传感器 位 置 
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(利用 朝 最 高 温度 梯度 方向 的 吸引 力 来 强化 算法 )] 进行 全 局 分 配 的 特征 。 在 Al- 
pha - like 处 理 器 芯片 核 之 后 ， 对 实验 芯片 进行 模拟 分 析 ， 通 过 循环 精确 架构 模 
拟 器 Gem5'! 、Watteht%] | Hotspot!” 来 模拟 它 的 功 耗 和 热 特性 。 

图 2. 26 显示 了 三 种 不 同 局 部 分 配 法 的 比较 结果 ， 即 WCC 法 、TGA 法 以 及 
HY 法 。 示 例 中 使 用 的 局 部 单元 为 一 个 处 理 器 的 微 架 构 单 元 ， 例 如 执行 单元 、 寄 
存 器 文件 、 各 种 序列 结构 、 私 人 LI 数据 以 及 指令 缓存 。 
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crafty || : 
equake g ; 


图 2.25 针对 SPEC 2000 基准 平台 ， 应 用 2D 分 配 、3D 分 配 以 及 TGA 
法 进行 非 均 匀 全 局 传感器 分 配 获得 的 最 大 温度 误差 
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图 2.26 “针对 SPEC 2000 基准 平台 ， 在 子 器 件 层 级 应 用 WCC ik, HY 法 以 及 TGA 法 
进行 非 均 匀 局 部 传感器 分 配 获得 的 最 大 温度 误差 


2.6.3 可 编程 器 件 的 传感器 分 配 和 布局 


热 对 微 处 理 器 以 上 的 计算 平台 有 很 大 影响 ， 存 储 设备 和 可 编程 器 件 会 承受 很 
高 的 功率 密度 ， 同 时 它们 的 温度 对 性 能 和 可 靠 性 有 负面 影响 。 基 于 此 原因 ， 对 可 
编程 器 件 的 传感器 布置 优化 开始 被 人 们 关注 并 进行 研究 。 对 于 商业 级 的 现场 可 编 
Fel MES ae (FPGA), ， 器 件 无 性 能 下 降 的 最 高 允许 运行 结 温 为 80%C ， 而 绝对 
安全 温度 限 值 为 125%C1%] 。 如 果 FPGA 的 平均 设计 图 覆盖 了 器件 90% 面积 ， 则 
可 能 会 导致 其 结 温 超 出 环境 温度 50C 以 上 。 假 如 试验 环境 温度 为 40% ， 在 无 风 
AVE Fs EA RI BE SES 90°C ， 而 在 有 风扇 的 条 件 下 结 温 可 能 会 降 到 75%C [%1 。 
由 于 及 才 的 限 值 ， 上 自然 散热 〈 如 大 散热 锅 ) 或 者 主动 散热 〈 如 风扇 ) 的 预防 措 
施 可 能 不 适用 于 一 些 租 入 式 应 用 场景 ,但 是 这 些 舱 入 式 的 应 用 场景 常会 用 到 FP- 
GA。 因 此 ， 人 们 希望 即使 在 很 重 的 工作 负载 下 ，FPGA 的 运行 温度 也 能 很 好 地 维 
持 在 75% 以 上 [8]。 
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基于 如 下 两 个 原因 ， 需 要 对 FPGA 进行 温度 监控 : QFPGA 会 产生 相当 大 的 
热量 ， 在 缺少 有 效 的 散热 措施 时 ，FPGA 的 工作 温度 可 能 会 超过 它 标 称 的 结 温 限 
值 。 由 于 65nm 及 其 以 下 的 芯片 制造 工艺 发 展 ，FPGA 的 热 耗 越 来 越 高 ， 工 作 负 
荷 也 越 来 越 重 。Q@FPCA 通常 用 于 快速 成 形 技术 和 仿真 ， 通 过 FPGA 收集 热 数 据 
对 表征 仿真 设计 非常 重要 。 

众所周知 ， 将 FPGA 应 用 到 实际 产品 时 ， 有 机 会 利用 其 可 编程 性 来 定制 温度 
传 感 絮 的 位 置 ， 即 通过 FPGA 器 件 的 本 身 资源 [可 编程 逻辑 单元 (CLB)] RÆ 
成 温度 传感器 。 同 时 ， 由 于 FPGA 会 通过 编程 来 执行 不 同 的 任务 ， 因 此 可 编程 器 
件 以 其 生成 的 物理 参数 (如 功 耗 和 温度 ) 的 准确 利用 率 是 无 法 提前 预知 的 。 根 
据 实际 应 用 情况 ， 来 决定 占用 还 是 不 占用 CLB。 在 两 种 不 同 应 用 场景 下 ， 同 一 颗 
FPGA 器 件 上 观察 到 的 功 耗 分 布 和 功率 密度 可 能 会 不 同 。 因 此 ， 热 点 的 位 置 与 实 
际 应 用 直接 相关 。 此 外 ， 现 代 FPGA 还 会 内 置信 号 处 理 单元 (DSP) 和 多 个 微 处 
理 芯 片 核 。 虽 然 这 些 内 置 核 可 能 不 会 被 用 到 ， 但 是 一 旦 在 某 些 场合 被 用 到 ， 它 们 
将 产生 一 个 局 部 热 。 由 于 在 均匀 逻辑 阵列 不 同 部 分 和 内 置 核 条 带 上 负载 不 一 致 的 
缘故 ，FPGA 上 可 能 会 有 多 个 热点 。 

利用 可 编程 性 ， 温 度 传 感 吉 在 被 映射 到 目标 器 件 之 前 ， 可 以 被 立即 能 和 人 到 实 
际 应 用 中 。 一 旦 需要 映射 的 应 用 被 确定 ， 就 能 识别 出 备 选 的 热点 位 置 ， 通过 
FPCGA 上 未 被 占用 的 可 编程 逻辑 单元 来 实例 化 传感器 。 基 于 环形 振荡 器 的 DTS, 
已 经 被 证 明 可 作为 有 效 手 段 监控 FPGA 的 温度 。 

为 了 读 取 传感器 后 端的 数值 ， 基 于 环形 振荡 右 的 传感器 的 静态 布局 会 占用 非 
常 多 的 资源 ， 并 且 需 要 很 大 的 通信 消耗 。 消 除 资源 消耗 的 一 种 方式 是 通过 动态 重 
编程 的 方法 插入 温度 传感器 抓 取 读 值 ， 并 且 腾 空 实 际 应 用 中 被 传感器 占用 的 资 
YR! 。 采 用 了 大 量 温度 传感器 的 大 FPGA 器 件 肯定 会 产生 非常 多 的 消耗 ， 特 别 
是 当 实际 运行 期 间 需 要 通过 温度 监控 来 执行 预防 措施 时 。 因 此 ， 为 了 降低 此 场景 
下 编程 的 运行 时 间 和 读 取 后 端的 延迟 ， 减 少 温度 传感器 的 数量 、 控 制 它 们 的 位 置 
(同时 保证 一 定 的 测量 精度 ) 变 得 非常 重要 。 为 了 实现 通过 较 少 的 投入 来 导入 温 
度 传感器 ， 其 至 允许 使 用 静态 布局 法 。 控 制 这 些 静 态 布置 的 传感器 ， 同 样 也 可 以 
简化 微 控 制 器 和 相关 的 外 围 设计 。 

针对 在 FPGA 内 进行 温度 传感器 的 系统 布局 ， 第 一 个 的 提出 方案 是 创建 数 个 
FZ IMC, BEM Bc, e C 以 描述 的 热点 为 圆心 ， 并 以 x; 为 半径 。 接 下 来 ， 问 
题 被 转化 为 找 出 最 小 的 可 用 CLB 位 置 ， 每 个 CLB 处 温度 传感器 都 将 被 实例 化 ， 
因此 ， 在 每 个 cj 区 域 至 少 需要 放置 一 个 传感器 [im 。 圆 形 区 域 的 半径 可 通过 式 
(2.17) 的 指数 函数 计算 ， 即 


ri =0. sk 


A 


fo. (2.17) 


图 2.27 显示 了 怎样 在 一 个 
逻辑 阵列 上 运行 算法 ， 热 点 附 
近 的 圆 形 区 域 代 表 着 它们 各 自 
的 范围 。 圆 形 区 域内 阴影 CLB 
则 代表 了 可 用 的 传感器 位 置 ， 
通过 未 被 占用 的 、 可 用 的 CLB 
覆盖 各 自 热 点 。 示 例 中 ， 传 感 
fs Blin A (hy. hy. hy), 


另 一 种 方法 ， 首 先 考虑 在 
整个 CLB 阵列 的 固定 网 格 内 ， 
放置 一 个 规则 的 传感器 阵列 ， 
此 布置 方式 又 被 称 为 基于 网 格 
布置 法 。 相 当 于 将 逻辑 阵列 分 
成 若干 网 格 ， 网 格 的 数量 同 传 
感 带 的 数量 相同 ， 每 个 传 感 融 
将 被 放置 在 每 个 网 格 的 中 心 ， 
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Hd 2.27 利用 热点 附近 的 圆 形 覆 盖 区 域 ， 


网 格 单元 又 被 称 为 相关 传感器 的 覆盖 区 域 。 图 2. 28a 描述 了 基于 网 格 布置 法 ， 放 


置 在 覆盖 区 域 中 心 的 传 感 如 的 温度 测量 值 可 以 代表 整个 覆盖 区 域 的 温度 。 


图 2.28 
a) 覆盖 边界 附近 基于 网 格 传感器 布置 法 b) 针对 多 个 热点 的 最 


少数 量 传感器 布置 法 ， 每 个 传感器 的 正方 形 覆 盖 区 域 覆 盖 4 个 热点 
但 是 ， 即 使 在 同一 覆盖 区 域内 ， 不 同位 置 点 的 温度 也 可 能 不 同 。 假 如 覆盖 区 域 中 心 
人 处 的 测量 温度 和 和 莉 盖 区 域 的 真实 温度 之 间 的 差 值 小 于 要 求 的 误差 A7， 则 测量 结 
可 接受 。 传 感 带 的 测量 范围 Sn 是 指 传感器 在 满足 测量 误差 小 于 要 求 的 AT 前 提 下 ， 


能 测量 到 的 最 远 距 离 。 和 覆盖 区 域 尺 寸 Co 被 定义 为 SpA PHBL, BIC) = V2SR。 以 传 
感 顺 为 中 心 点 ， 构 成 一 个 长 和 宽 均 为 小 于 等 于 Cb 正方形， 正方 形 覆 六 区 域内 所 有 
热点 的 测量 精度 均 可 满足 测量 误差 小 于 A7。 尽 管 此 类 基于 网 格 传 感 顺 布 置 法 非常 
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合理 , 但 是 随 CLB 阵列 太 才 的 增加 ， 要 求 的 传感器 数量 也 会 成 比例 增加 。 为 了 进 
一 步 减 少 传感器 阵列 的 尺寸 ， 一 些 优化 布局 算法 的 方法 被 提出 [ -1081 

其 中 一 种 方法 借鉴 了 物理 设计 的 递归 二 分 算法 ， 图 2. 28b 说 明了 其 基本 原 
理 ， 并 将 其 同 简单 的 基于 网 格 方法 进行 了 比较 。 该 方法 的 目的 是 为 了 进一步 的 减 
少 传感器 数量 ， 以 及 决定 能 覆盖 测量 一 组 热点 的 传感器 位 置 。 如 上 面 提 到 的 ， 每 
个 传 感 带 都 有 一 个 覆盖 区 域 ,其 尺寸 为 Cpo Pelis S, 可 以 测量 覆盖 区 域内 所 有 
热点 的 温度 ,覆盖 区 域 的 最 大 长 和 宽 为 Co。 该 算法 尝试 构建 一 组 正方 形 区 域 ， 
每 个 正方 形 区 域 都 有 自己 的 长 和 宽 ， 最 大 为 Cop， 并 且 每 个 正方 形 区 域 都 能 覆 闭 
一 组 热点 ， 温 度 传 感 顺 被 放置 在 每 个 正方 形 区 域 的 中 心 处 。 正 方形 区 域 面积 取决 
于 传 感 带 需要 履 盖 的 热点 位 置 ， 它 的 边 长 可 以 小 于 Co ， 这 就 是 为 什么 履 盖 区 域 


的 形状 仍 为 正方 形 但 尺寸 不 一 定 是 最 DS - -- 
大 的 Cy x Co 的 原因 。 假 如 围绕 热点 à : p 

hi, ha, ha, hy, hg5 个 热点 创建 一 " La id 

个 边界 矩形 R, fe eae 5 位 于 边界 矩 下 5=SR 
形 中 心 ， 热 点 h 到 传感器 的 距离 为 q p EU 
m1 ， 类 似 的 到 其 他 热点 的 距离 表示 为 OD | 

rp 、r3、r4、Ts。 因 为 边界 矩形 的 边 长 ^ | 


最 大 为 Cy, WR Cy =25,, Wi 
KEI R 内 任 一 热点 到 传感器 S 的 最 大 图 2.29 传感器 位 于 尺寸 为 Cp x Cy 
距离 可 以 是 Sh ， 如 图 2.29 所 示 。 的 正方 形 覆 六 区 域 中 心 处 

热点 太 和 访 位 于 边界 矩形 的 两 个 对 角 点 ， 它 们 到 传感器 S 的 距离 最 远 。 示 例 中 ， 
ri =rs =Sn。 其 他 热点 到 传感器 S 的 距离 较 近 一 些 ， 表 示 为 r, 34 <SR。 因 此 如 果 将 传 
感 融 放置 在 边界 和 矩形 区 域内 ， 且 和 矩形 的 长 和 宽 尺 寸 为 最 大 的 Cy, WUT PRESET PN ir 
有 热点 均 在 传感器 测量 范围 内 。 

上 述 算法 通过 递归 法 在 热点 附近 创建 一 个 边界 矩形 尺 ， 并 沿 和 矩形 边 长 方向 
将 矩形 进行 二 分 ， 直 到 和 矩形 R; 的 长 和 宽 均 小 于 等 于 Co ， 传 感 器 的 数量 n 和 和 矩形 
RR,，…，R, 的 数量 相关 。 每 个 矩形 R 都 覆盖 了 多 个 热点 ， 热 点 阵列 为 LH ， 通 过 
两 对 坐标 (x, y) FRAN FETE KIR R, BM (xha. Ybowon)， Chig Yop) B 
2.30a ~ f 描述 了 算法 的 步骤 。 


2.6.4 温度 传感器 分 配 和 布局 的 最 新 进展 


早期 对 处 理 咒 忆 片 和 可 编程 器 件 温度 传 感 器 分 配 和 布置 算法 的 研究 主要 着 重 
于 获取 良好 测量 精度 和 /或 减 小 硬件 成 本 11071091 

当 温 度 传 感 右 布置 受 布局 和 其 他 设计 限制 时 ， 其 中 一 个 解决 方法 是 将 问题 转 
化 为 网 格 内 所 有 热点 位 置 和 多 个 备 选 传感器 位 置 之 间 匹配 函数 。 热 点 的 位 置 用 集 
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c) 


d) e) f) 
图 2.30 传感器 布置 的 递归 二 分 算法 演变 过 程 
a) 所 有 热点 附近 的 初始 边界 矩形 Li = (R) b) SOMBIE R , Lrpc = ||] 

c) 压缩 边界 矩形 ,Lr = (R, Ra} d) LAMER, La. = (R3, Ry, Rs} e) SOMBER, 

Dre = {R4, Rs, Re, Ra} £) 二 分 矩形 Re 和 已 ，Pnee = {R4, Rs, Rg, Ro, Rio, Ru} 
Q= [q. s, qn] 表示 ， 每 个 位 置 对 应 的 期 户 测 量 精度 用 集 E= [e e, e] 
表示 。 人 尽管 对 每 个 独立 热点 要 求 一 个 单独 的 精度 数值 (或 者 进行 量化 ) 不 可 取 ， 
但 是 解决 问题 的 一 般 公 式 还 是 可 以 察觉 到 ， 而 且 公 式 通 常 都 能 进一步 简化 。 同 样 
地 ， 备 选 传感器 的 位 置 定义 为 工 = [4 ，…，, 下]。 采 用 上 述 定 义 方法 的 目的 是 为 
找 出 工 最 小 的 子 集 $， 因 此 ， 每 个 热点 为 9i 都 将 有 一 个 配备 的 传感器 为 Sjo MH. 
传感器 5 的 温度 测量 值 和 热点 g; 的 实际 温度 值 之 间 的 差 值 会 一 直 小 于 绑 定 的 精度 
eillo] 。 根 据 位 置 距离 - 温度 测量 精度 的 模型 ， 对 每 个 传感器 附近 的 可 观察 区 域 
定义 一 个 固定 精度 ， 可 通过 此 方法 解决 上 述 问题 。 位 置 距 离 - 温度 测量 模型 同样 
遵循 前 面 章节 中 讨论 的 相似 原理 (在 热点 附近 定义 圆 形 区 域 ) 100) 。 如 果 这 些 网 
格 点 中 任 一 热点 位 置 位 于 传感器 的 观察 区 域内 ， 则 表示 它们 是 匹配 的 。 因 为 它 可 
被 进一步 被 转化 为 用 网 格 位 置 来 进行 离散 选择 的 问题 ， 所 以 可 以 通过 一 个 基于 整 
数 线性 规划 (ILP) 函数 来 解决 此 优化 选择 问题 。 

另外 一 个 关于 传感器 分 配 法 的 观点 认为 ， 由 于 峰值 温度 点 将 会 表明 DTM 干预 
频率 以 及 更 加 直接 的 影响 可 靠 性 ， 因 此 研究 应 该 侧重 于 降低 最 差 情况 下 传感器 的 测 
量 误差 ， 而 不 是 平均 测量 误差 95] 。 为 了 解决 此 问题 ， 一 个 两 阶段 启发 式 算 法 被 提 
出 。 第 一 阶段 是 产生 一 组 初始 的 位 置 ， 第 二 阶段 通过 迭代 的 方式 来 进一步 优化 第 一 
阶段 的 结果 。 通 过 一 个 变化 的 矩阵 体积 采样 方法 导入 第 一 阶段 0%1 ， 主 要 方法 是 : 
一 开始 ， 选 定 p 个 潜在 传感器 的 位 置 ， 并 用 大 个 传感器 数量 创建 一 个 初始 的 解决 方 
案 ， 选 出 的 大 个 传感器 要 能 最 大 限度 地 体现 热 行为 的 多 样 性 〈 独 立 性 ) 。 每 个 传 感 
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顺 都 通过 一 个 温度 值 为 ”的 矢量 来 表示 ， 矢 量 通过 仿真 观察 传感器 位 置 处 的 热 行为 
轨迹 归纳 得 出 ， 整 个 传感器 组 通过 一 个 p x n 的 矩阵 表示 。 首 先 选 出 一 个 传感器 位 
置 ， 要 求 该 传 感 锅 位 置 的 欧 几 里 得 距离 温度 最 大 。 在 接 下 来 的 上 -1 KEP, 
过 算法 对 可 用 传 感 带 位 置 的 列 矢量 中 的 正 交 带 件 进行 计算 ， 找 出 欧 几 里 得 距离 最 大 
的 位 置 点 。 由 初始 一 组 大 个 传感器 开始 ， 进 行 算法 的 第 二 阶段 ， 针 对 每 个 传感器 进 
行 一 次 迭代 计算 。 在 每 次 迭代 中 ， 固 定 其 他 有 -1 MERRE, 针对 用 于 计算 
的 每 个 传 感 融 ， 找 出 能 实现 最 差 情 况 下 最 小 测量 偏差 的 最 好 的 可 能 位 置 。 

关于 传 感 需 布置 法 最 新 研究 的 一 个 首要 目的 是 解决 如 何 通 过 有 限 数量 的 传 感 噩 
构建 一 个 详细 的 温度 图 。 针 对 该 问题 提出 的 观察 和 计算 方法 被 重新 应 用 于 传感器 布 
置 ， 因 此 一 个 良好 的 温度 传感器 布置 法 被 定义 为 能 减 小 温度 图 重 构 误差 的 方法 7 。 


2.7 间接 温度 监测 


在 芯片 内 置 传感器 领域 ， 针 对 传感器 分 配 和 布置 的 设计 ， 以 及 优化 方 需求 越 
来 越 迫切 ， 市 场 上 出 现 了 一 些 尝试 用 替代 指示 器 来 推导 出 IC 芯片 热 状态 的 方法 。 
这 些 方法 主要 用 于 微 处 理 器 芯片 的 开发 ， 微 处 理 器 的 软件 层 可 以 动态 地 收集 系统 
事件 和 性 能 指示 器 的 数据 ， 人 们 研究 开发 出 了 一 些 完全 依赖 于 这 些 指示 器 的 轻 载 
在 线 温度 预测 器 。 在 大 多 数 实际 应 用 场景 中 ， 没 办 法 采用 类 似 于 第 1 章 图 1.9 中 
描述 的 热 网 格 模型 对 测量 系统 进行 详细 热 仿真 。 但 是 ， 各 种 解决 方案 还 是 考虑 通 
过 一 些 简单 关系 来 预测 温度 ， 并 抓 取 每 个 系统 的 热 特性 。 系 统 的 热 特性 表现 为 每 
个 系统 事件 的 执行 动作 和 估计 功 耗 的 函数 。 

从 目前 的 一 些 趋势 分 析 ， 包 括 一 些 商业 微 处 理 器 内 集成 的 传感器 数量 越 来 越 
多 ， 间 接 的 测量 方法 仍 无 法 替换 芯片 内 置 传感器 的 方法 。 甚 至 ， 在 一 些 其 他 系统 器 
ft (如 DRAM， 移 动 设备 中 的 电源 ) 组 入 的 传感器 数量 也 越 来 越 多 。 但 是 ， 间 接 
方法 仍然 可 以 提供 有 效 的 预 判 ， 并 且 能 和 基于 硬件 的 热 测量 单元 一 起 协同 运作 。 

基于 软件 的 热 测 量 通常 基于 以 下 设计 理念 : 设计 一 个 非常 快速 的 方法 来 求解 
等 效 热 网 格 公式 ， 它 会 采用 性 能 计算 器 中 获取 的 估算 功 耗 值 作 为 输入 。 下 述 两 种 
方法 的 主要 区 别 在 于 具体 的 计算 工具 不 同 。 计 算 工 具 是 指 在 运行 期 间 进行 快速 热 
仿真 的 工具 。 其 中 一 个 方法 ， 从 软件 层级 导入 轻 载 实 时 温度 指示 右 ， 它 又 被 称 为 
虚拟 传感器 [8] ， 它 将 一 个 动态 在 线 功 耗 先 验 模 型 0 和 一 个 热 阻 网 格 模型 的 快 
速 求解 器 耦合 使 用 。 另 外 一 种 方法 则 是 引入 所 谓 的 软件 传感器 ， 性 能 计算 器 内 的 
统计 数据 会 被 输入 到 数字 模型 中 ， 进 行 温度 求解 [11?] 。 

通过 将 功能 单元 的 每 次 接 入 功 耗 同 从 性 能 计算 器 中 获取 的 全 部 执行 动作 进行 
关联 ， 从 而 估算 出 每 个 处 理 器 核 的 功 耗 值 !521 (以 Pentium 4 为 例 ) 。 然 后 通过 一 
个 简化 的 方法 ,求解 芯片 内 核 热 响应 的 热 等 效 二 阶 微分 方程 。 需 要 特别 注意 的 
是 ， 采 用 频 域内 的 动 差 拟 合法 来 计算 系统 的 瞬 态 热 响应 ， 主 要 的 假设 条 件 为 : 等 
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效 热 模 型 受 少数 几 种 系统 状态 控制 ,通过 动 差 拟 合法 找 出 传递 函数 中 对 应 的 极 
点 。 基 于 线性 系统 理论 ， 人 们 提出 了 一 个 专门 的 求解 器 将 芯片 模拟 成 一 个 定常 的 
线性 系统 ， 该 系统 的 热 响 应 与 功 耗 呈 线 性 关系 531 。 

间接 温度 记录 可 被 视 为 温度 预计 方法 的 一 个 特别 分 文 ， 旨 在 猜测 未 来 系统 的 
热 状 态 。 基 于 此 特定 的 背景 ， 我 们 仅仅 只 阐述 了 通过 系统 当前 执行 动作 指示 器 来 
预计 系统 当前 热 状 态 的 方法 。 这 些 间接 测量 方法 ， 一 般 都 不 需要 必 片 内 置 监控 天 
或 板 级 硬件 监控 咒 中 的 温度 和 电流 反馈 信号 〈 用 于 佑 算 功 耗 ) 。 在 进行 温度 侦 测 
时 ， 它 们 完全 通过 软件 层级 来 实现 ， 利 用 面向 操作 系统 (OS) 的 性 能 计算 器 、 
工作 载荷 和 利用 率 指示 噩 来 完成 间接 测量 。 另 一 方面 ， 这 些 间 接 方法 通常 都 需要 
一 个 较 大 的 历史 事件 记录 窗口 ， 用 于 记录 动作 指示 器 和 硬件 监控 器 的 反馈 数值 
(包括 温度 传 感 需 ) 。 
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$38 
动态 热管 理 


当前 市 场 上 的 处 理 需 、 寄 存 需 以 及 片上 系统 都 有 特定 的 机 制 来 管理 电源 电 
压 、 时 钟 频率 和 冷却 系统 。 这 些 特定 管理 机 制 的 实现 都 是 基于 芯片 内 部 温度 传 感 
器 的 反馈 。 大 部 分 商用 器 件 都 会 引入 一 个 额外 的 温度 管理 单元 。 例 如 ， 早 期 IBM 
PowerPC 处 理 器 内 部 的 热 辅 助 单元 (TAU) ^, IBM Power6 和 Power7 上 的 能 量 微 
管理 器 [2 -4] ， 英 特 尔 热 监控 技术 TMI 和 TM215] AMD 处 理 器 内 部 的 热管 理 中 
心 [51 。 除 此 之 外 ， 还 有 大 量 的 关于 主动 和 被 动 热管 理 的 学 术 研 究 。 所 有 这 些 统 
称 为 动态 热管 理 (DTM) 。 大 部 分 时 间 ，DTM 都 需要 和 动态 功率 管理 系统 进行 协 
同 工 作 。 因 此 本 章节 会 将 两 种 机 制 放 在 一 起 讨论 。 

芯片 温度 传感器 是 DTM 单元 部 署 在 高 性 能 芯片 和 高 端 小 型 移动 设备 的 重要 组 
成 部 分 。 在 过 去 的 十 年 中 ，DTM 已 经 成 为 工业 创新 和 学 术 研 究 的 一 个 丰富 的 领域 。 
为 了 最 大 限度 地 覆盖 分 散 排 布 在 整个 芯片 上 旦 数量 越 来 越 多 的 内 置 热 传 感 融 ， 通 常 
通过 一 个 底层 的 基础 构架 将 它们 连接 在 一 起 。 底 层 的 基础 架构 提供 传递 到 传感器 上 
的 偏 置 电流 和 电压 ， 完 成 收集 测量 并 执行 和 信和 号 转换 。 同 时 将 温度 读数 传递 给 外 部 
热管 理 单元 。 它 需要 跨越 一 个 长 的 距离 以 覆盖 整个 处 理 器 核心 ， 连 接 越 来 越 多 的 设 
备 。 因 此 ， 在 全 局 范围 内 看 ， 这 种 基础 的 构架 是 芯片 内 的 重要 因素 ， 在 日 益 复 杂 的 
每 一 代 新 兴 处 理 器 中 ， 它 的 设计 成 为 了 一 个 十 分 关键 的 部 分 。 此 外 ， 为 了 防止 热 应 
力 过 大 ， 热 管理 系统 对 温度 传感器 读数 反馈 的 具体 方式 也 是 一 个 重要 问题 。 不 同 的 
系统 有 不 同 的 反馈 方式 ， 大 量 的 学 术 工 作 一 直 致 力 于 寻求 更 好 的 替代 方法 。 

本 章 中 ， 我 们 将 首先 描述 一 个 重要 的 全 局 热管 理 基 础 构架 示例 ， 包 括 传 感 磊 
接口 和 反馈 控制 途径 。 接 下 来 ， 将 探讨 传 感 控 制 之 间 的 相互 作用 DTM 方法 ， 同 
时 也 会 讨论 控制 絮 之 间 的 相互 干预 。 在 第 一 级 管理 上 ， 时 钟 频率 和 电源 电压 主要 
用 来 控制 硬件 的 热 啊 应 。 这 种 管理 可 以 抽象 为 两 个 主要 层面 的 管理 。 大 部 分 的 第 
一 响应 机 制 是 由 硬件 直接 进行 。 温 度 和 功率 测量 结果 通过 各 种 接口 技术 上 报 给 系 
统 软 件 。 系 统 软件 将 硬件 上 报 的 信息 与 系统 级 参数 (如 处 理 器 利用 率 ) 相 结 合 ， 
可 以 执行 额外 的 管理 ， 通 常 它 会 发 生 在 更 大 的 时 间 尺 度 上 。 本 章 也 将 讨论 全 局 
DTM 机 制 执行 的 具体 算法 ， 这 些 算法 根据 温度 反馈 ,通过 调节 主要 性 能 参数 
(如 电压 ， 频 率 等 )， 控 制 底层 系统 的 热 状 态 。 我 们 还 将 讨论 学 术 研 究 的 成 果 ， 
其 目的 是 采取 系统 级 热管 理 进一步 执行 额外 的 决策 机 制 ， 如 任务 分 配 、 内 存 芯 片 
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的 数据 布局 和 任务 迁移 。 


3.1 心 片 温度 传 感 费 的 接口 和 动态 热管 理 系统 


DTM 的 系统 硬件 结构 可 分 为 两 个 主要 的 组 件 ， 即 有 温度 传感器 输出 的 传 感 
器 网 络 和 实现 电压 与 频率 管理 的 控制 接口 。 可 以 说 ， 整 体 热 监测 和 管理 基础 设施 
的 设计 是 非常 重要 的 ， 对 于 整体 热管 理 的 准确 性 和 质量 而 言 ， 它 和 这 个 网 络 中 的 
单 体 传 感 设 备 同 等 重要 。 温 度 传感器 一 方面 接收 来 自 源 网 络 和 镜像 电路 的 偏 置 电 
流 和 /或 电压 。 另 一 方面 ， 通 过 DTM 硬件 将 它们 的 数字 输出 分 配 到 一 个 或 几 个 处 
理 的 中 心 位 置 。 将 在 下 面 章 节 中 描述 其 具体 结构 。 


3.1.1 温度 传感器 的 偏 置 网 络 


电流 分 布 结构 是 芯片 上 模拟 温度 传 感 右 网 络 的 一 个 组 成 部 分 。 这 些 传感器 需 
要 用 一 个 恒定 的 电流 源 进 行 偏 置 ， 它 们 从 内 部 获得 多 个 参考 电流 和 电压 。 在 传 感 
器 所 在 位 置 处 的 专用 模拟 电路 提供 本 地 偏 置 ， 给 系统 带 来 了 更 多 的 复杂 性 。 在 较 
老 的 工艺 节点 ,设计 出 更 大 规模 的 、 对 工艺 和 热 变 化 具有 更 强 适应 性 的 模拟 部 件 
是 可 能 的 。 温 度 和 工艺 变化 的 各 种 补偿 技术 也 可 以 应 用 到 电流 源 和 电压 产 ， 以 提 
高 它们 对 源 的 变化 的 敏感 性 局- 。 此 外 ， 校 准 过 程 中 系统 的 变化 一 定 程度 上 也 
可 以 计算 出 来 。 然 而 ， 随 着 工艺 技术 的 缩放 ， 为 了 保持 传 感 需 所 在 点 具有 同 级 别 
的 免疫 力 ， 电 路 的 设计 变 得 越 来 越 具有 挑战 性 。 现 代 蕊 片 越 来 越 高 的 品 圆 温度 也 
进一步 加 剧 了 模拟 元 器 件 的 热 灵 敏 度 。 

现代 高 性 能 芯片 中 ， 为 了 获得 更 好 地 控制 和 可 预测 模拟 源 ， 在 中 心 位 置 建立 
了 传感器 后 端 偏 置 。 例 如 ， 在 AMD 四 核 卑 龙 处 理 器 的 温度 监测 系统 中 ， 每 个 核 
心包 含 多 个 远程 温度 传 感 融 分 布 在 核心 中 ， 传 感 带 读数 发 送 到 一 个 中 心 热 评 佑 单 
位 [61 Duarte 等 讨论 了 在 英特尔 奔腾 4 处 理 器 中 应 用 先进 的 热 传 感 技 术 。 在 处 
理 器 中 使 用 了 本 地 和 远程 传感器 "1 。 在 这 些 系统 中 ， 为 带 隙 电路 产生 参考 电压 
或 电流 的 传 感 需 后 端 组 件 需要 一 个 专用 电流 源 偏 置 网 络 。 构 建 基础 架构 方法 的 不 
同 可 能 会 导致 显著 不 同 的 监测 结果 。 我 们 将 说 明 网 络 结构 的 后 果 ， 通 过 对 比 所 选 
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持 一 定 的 距离 ， 它 的 输出 电压 Vas 需要 进行 测量 和 处 理 。 图 中 用 一 个 二 极 管 来 描 
述 传感器 ， 但 它 本 质 上 是 在 一 个 晶体 管 或 MOSFET 上 构建 的 ， 其 相应 的 构建 方 
法 在 第 2 章 有 详细 的 描述 。 

前 面 提 到 的 设计 挑战 是 偏 置 电路 结构 固有 的 ， 还 有 另 一 个 导致 不 准确 的 因素 
是 源 于 配 电网 络 结构 的 堵塞 。 连 接 传感器 和 电压 测量 模块 的 导线 与 申 联 电阻 R 
相关 ， 它 是 沿 导 线 长 度 的 温度 分 布 函数 。 

R, = Ro(1 +B] (T(x,y) - Ta) d/h dl) CEP 
式 中 ，R。 是 室温 下 互 连 的 电阻 率 (假定 室温 为 25C ) ; B 是 电阻 的 温度 系数 ， 沿 
导线 长 度 积分 。 在 式 (3.1) 中 ， 这 两 个 积分 的 比值 可 以 被 理解 为 相对 于 沿 互 连 
标 称 温度 的 平均 温度 变化 ， 标 记 为 AT, 

模拟 传感器 提供 的 结 温 最 终 由 电压 差 和 R, 求 得 ， 即 
Ty =Q(Vineas -IcR,) +7 (3.2) 

x (3.1) MÈ (3.2) 表明 ， 如 果 没 有 足够 的 沿 着 传感器 后 端 输出 到 中 央 
传感器 处 理 单元 的 导线 温度 分 布 数据 ， 那 么 无 法 精确 地 确定 实际 结 温 。 如 果 后 端 
和 测量 /数字 转换 电路 彼此 远离 ， 那 么 它们 之 间 的 互 连 就 必须 覆盖 足够 的 距离。 
在 现 有 的 一 些 设计 中 ， 这 些 互 连 线 可 能 需要 跨 过 整个 处 理 器 核 。 可 以 肯定 的 是 ， 
高 性 能 处 理 器 在 如 此 长 距离 上 的 热 分 布 将 显著 变化 。 更 进一步 讲 ， 很 难 获得 这 一 
温度 分 布 图 。 因 此 ， 由 A7,,, 引 入 的 测量 误差 是 无 法 被 任何 一 种 校准 所 补偿 。 

图 3.2 描绘 了 互 连 电阻 对 测量 精度 的 影响 。 这 项 研究 是 基于 65nm 技术 开展 
的 ， 连 接 传感器 后 端 和 电压 测量 点 的 铜 的 宽度 和 长 度 分 别 为 180nm 和 3mm, Mi 
置 电流 为 10uA。 传 感 器 位 置 的 温度 保持 在 35°C 时 ， 温 度 值 沿 连接 线 是 变化 的 。 
图 中 用 实 线 面 出 了 测 得 的 温度 Tu 和 AT。, 之 间 的 关系 。 测 得 的 温度 值 是 由 式 
(3.2) 求 得 的 。 传 感 器 位 置 的 温度 恒定 在 35°C ， 图 中 使 用 虚线 进行 了 标示 。 随 
着 AT 的 增加 ， 我 们 观察 到 实际 温度 与 实测 温度 之 间 存 在 显著 的 不 一 致 性 。 例 
W, “AT, Je 25 ， 测 量 误差 可 达 5°C 。 在 现代 微 处 理 器 中 ， 当 运行 不 同 的 应 
用 程序 时 ， 不 同位 置 的 晶 圆 温度 可 以 显著 不 同 。 根 据 热 节 流 阔 值 ， 关 键 的 功能 
位 ， 如 整数 / 浮 点 ALU 、 整 数 /浮动 寄存 器 文件 和 指令 队列 可 以 超过 90"C 。 其 他 
功能 单元 的 温度 可 以 在 60% 。 因 此 ， 高 至 25% 的 AT,,, 并 不 常见 。 

为 了 降低 两 线 测量 的 不 准确 性 ， 另 一 种 方法 是 使 用 四 线 ( 开尔文》 测量 ， 
如 图 3.3 所 示 。 在 四 线 网 络 测量 ， 通 过 电压 测量 网 络 的 电流 可 以 忽略 不 计 ， 测 量 
得 到 的 电压 等 于 传感器 后 端的 输出 电压 ， 没 有 引入 R.。 因 此 ， 串 联 电阻 丝 及 其 
热 依赖 性 不 影响 测量 精度 。 然 而 ， 四 线 测量 要 求 更 多 的 资源 ， 因 此 整个 路 由 基础 
设施 中 除了 包括 偏 置 电流 分 布 网 络 ， 还 需要 包含 电压 测量 网 络 。 电 流 分 配 网 络 的 
成 本 可 以 通过 使 用 电流 镜 来 降低 。 
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图 3.2 经 过 很 长 连接 的 模拟 传感器 修正 值 表 示 为 A7,,, 的 函数 
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图 3.3 模拟 传感器 后 端的 四 线 (开尔文 ) 电压 测量 。 路 由 网 路 包括 一 个 专门 
的 偏 置 电流 分 配 网 络 和 一 个 专门 的 电压 输出 采集 网 络 


图 3. 4a 使 用 了 PMOS 晶体 管 描述 共 源 共 栅 电流 镜 的 结构 。 共 源 共 机 电流 镜 
像 结 构 输 出 电阻 较 高 ， 因 而 能 消除 电流 镜 和 热 传 感 器 之 间 的 耦合 影响 。 图 3. 4b 
给 出 了 同 为 每 个 心 片 温度 传 感 涡 后 端 使 用 专用 的 电流 源 相 比 ， 使 用 电流 镜像 树 带 
来 的 好 处 .31 。 在 网 络 中 引入 电流 镜 后 ， 淘 汰 了 一 个 电流 源 和 一 部 分 的 互 连 。 需 
要 注意 的 是 ， 新 产生 的 电流 分 布 网 络 具 有 树 的 拓扑 结构 。 

电流 镜 在 监测 系统 中 是 潜在 不 准确 性 的 源头 。 首 先 ， 由 于 过 程 的 变化 ， 电 流 
镜 (输出 电流 与 输入 电流 ) 的 匹配 比 可 能 不 完全 统一 。 其 结果 是 ， 实 际 偏 置 电 
流 的 热 二 极 管 可 能 偏离 电流 源 产 生 新 的 电流 。 人 然而， 这 一 过 程 变化 对 系统 精度 的 
影响 是 静态 的 。 也 就 是 说 ， 每 个 单独 的 电流 镜 的 匹配 率 在 制造 完成 后 是 固定 值 。 
因此 ， 传 感 器 精度 的 过 程 变化 对 其 精度 的 影响 可 以 通过 矫正 减轻 。 其 次 ， 空 间 和 
时 间 的 温度 变化 对 电流 镜 的 匹配 比 也 有 影响 。 另 一 方面 ， 电 压 测 量 的 内 部 连接 将 
直接 从 热 二 极 管 路 由 到 电压 测量 电路 ， 如 图 3. 5b 所 示 。 串 扰 噪 声 是 电压 测量 不 
准确 性 的 来 源 ， 可 通过 添加 足够 的 屏蔽 线 最 小 化 这 种 效果 ， 目 前 在 工业 应 用 中 有 
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图 3.4 利用 电流 镜 结构 
a) 晶体 管 级 电流 分 布 图 网 络 b) 引入 电流 镜 带 来 的 好 处 


这 样 的 应 用 案例 。 此 外 ， 由 于 热 时 间 常 数 数量 级 大 概 在 毫秒 左右 ， 大 于 时 钟 周期 
时 间 几 个 数量 级 ( 纳 秒 级 的 ) ， 所 以 可 以 在 多 个 时 钟 周期 采样 电压 ， 利 用 平均 电 
压 进 行 温 度 计算 。 它 可 有 效 地 过 滤 互 连 之 间 的 耦合 所 带 来 的 不 准确 性 。 

电流 网 络 也 可 扩展 到 支持 更 多 数量 的 传感器 。 图 3. 5 显示 的 是 支持 四 传 感 需 
的 网 络 。 再 次 ， 请 注意 ， 模 拟 传感器 后 端 已 被 描绘 为 便于 说 明 的 热 二 极 管 ， 它 们 
可 以 用 各 种 带 隙 电路 来 构建 。 注 意 ， 为 了 便于 在 适当 的 方向 创建 电流 ， 我 们 在 树 
上 使 用 了 交流 NMOS 和 PMOS 电流 镜 ， 这 是 非常 有 必要 的 。NMOS 电流 镜 的 输 
入 /输出 电流 向 内 ， 而 PMOS 电流 镜 的 输入 /输出 电流 的 向 外 。 

电流 镜 的 结构 很 简单 。 可 以 利用 布局 空白 的 地 方 将 它们 能 和 到 芯片 中 。 电 流 
镜 的 面积 与 中 继 器 的 面积 相当 。 因 此 ， 像 中 继 器 一 样 ， 电 流 镜 可 插入 到 芯片 [31 
的 空白 位 置 。 而 且 ， 插 入 电 流 镜 可 以 在 后 布局 阶段 进行 。 这 对 设计 流程 的 必要 修 
改 是 最 少 的 。 此 外 。 电 流 镜 可 以 扩展 到 用 一 个 输入 电流 映射 到 两 个 以 上 的 输出 电 
流 。 然 而 ， 电 流 镜 插 入 空白 区 域 的 容量 是 有 限 的 ， 所 以 电流 镜 的 输出 电流 不 可 能 
非常 大 。 

与 两 线 测 量 所 使 用 的 路 由 网 络 相 比 ， 上 面 所 述 的 四 线路 由 网 络 具 有 更 高 的 精 
度 。 然 而 ， 它 具有 较 高 的 互 连 开销 。 电 流 镜 有 助 于 减少 这 方面 的 开销 。 但 是 ， 如 
何 分 配 和 安置 电流 镜 以 获得 最 小 线 长 的 问题 还 有 待 解 决 。 应 对 这 一 挑战 可 能 的 方 
法 是 在 图 上 建立 一 个 Steiner 最 小 树 问 题 。 在 给 定 的 芯片 构造 加 权 图 中 ， 每 个 顶 
点 表示 一 个 模拟 传感器 后 端 / 空 白 。 两 个 顶点 之 间 边 的 权重 等 于 相应 的 传感器 / 空 
格 之 间 的 曼哈顿 距离 (假设 沿 直 线路 径 )。 图 上 最 小 Steiner 树 问 题 是 一 个 研 经 过 
足够 研究 的 问题 (5,11。 但 是 同 其 他 变种 不 同 ，Steiner 点 不 能 任意 大 。 如 前 所 
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图 3.5 偏 置 电流 分 配 网 络 支持 四 个 二 极 管 


述 ， 每 个 空白 区 域 的 容量 是 有 限 的 。 这 意味 着 晶体 管 的 数量 ， 以 及 占据 空白 区 域 
的 电流 镜 的 输出 电流 数 都 不 能 任意 大 。 所 以 ， 每 个 可 能 的 Steiner 点 都 和 Steiner 
树 的 上 限 有 关 。 此 外 ， 传 感 器 构成 树 的 叶子 节点 。 这 种 约束 相当 于 传感器 节点 的 
需求 最 多 是 一 个 。 而 且 ，Steiner 点 和 叶 节 点 都 与 Steiner 树 上 的 上 限 有 关 。 有 界 
最 小 Steiner 树 (BDSMT) 是 个 环 手 的 问题 。 对 这 种 变 体 的 最 小 Steiner 树 问题 ， 
已 有 人 提出 了 一 个 基于 ILP 的 解决 方案 (17]。 

表 3.1 提供 了 构建 传感器 偏 置 电流 的 两 种 路 由 网 络 的 线 长 比较 数据 。CMT 
表示 由 BDSMT 函数 5 构造 的 电流 镜 树 拓 扑 。DCS 表示 专用 电流 源 拓扑 。 三 个 
示例 的 传感器 数量 分 别 为 两 个 、 四 个 和 八 个 。 传 感 器 网 络 琶 加 在 一 个 单 核 处 理 需 
的 平面 (Alpha EV 6), ， 它 使 用 了 优化 的 传感器 配置 技术 [1] 。 传 感 器 放置 算法 的 
目标 是 在 传感器 数量 一 定 和 典型 工作 负载 的 条 件 下 ， 将 测量 误差 降 到 最 低 。 使 用 
这 个 工具 ， 可 生成 不 同 传感器 数量 条 件 下 的 排 布 方法 。WL 列表 示 当 前 配 电网 每 
个 基准 总 的 线 长 (电压 测量 网 络 也 被 计算 在 内 ， 因 为 它 在 设计 上 是 一 样 的 ) 。 
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BDSMT 实例 的 ILP 函数 用 CPLEX 10.1 求解 。 相 对 节省 的 电线 长 度 可 高 达 
42.74% ， 平 均 为 27.65% 。 表 3.2 总 结 了 传感器 网 络 测量 精度 ， 它 采用 了 以 上 
两 种 校准 方案 。BDSMT 基础 机 构 在 两 点 矫正 下 可 获得 1%C 的 精度 ， 三 点 矫正 可 以 
获得 0. 6C 以 下 的 精度 。 
表 3.1 热 传 感 器 交流 配 电 网 络 的 线 长 (CMT 代表 电流 镜像 树 结 构 ， 
DCS 表示 为 每 一 个 传感器 后 端的 专用 电流 镜像 的 拓扑 结构 ) 


基准 CMT DCS 

名 字 二 极 管 数量 线 长 /mm 线 长 /mm Impr% 
Rbsl 2 12. 25 13. 59 9. 86% 
Rbs2 4 21.24 30. 49 30. 3496 


Rbs3 8 40. 43 70. 61 42.74% 


表 3.2 处 理 器 中 动态 电压 和 频率 缩放 的 代表 性 范围 示例 


处 理 器 电压 范围 时 钟 频率 范围 
英特尔 奔腾 M 0. 956 ~ 1. 484V 600 MHz ~1.6 GHz 


1.2 ~3.2 GHz (每 100MHz 为 一 档 ) 
超频 水 平 : 3.3 ~3.4GHz 


UBER BERE 17 0. 707 ~ 1. 86V 


AMD FX - 8120 Bull- 


0. 875 ~ 1. 412V 1.4 «3.1 GHz (每 100MHz 为 一 档 ) 
超频 水 平 可 达 4. 0GHz 


dozer 


3.1.2 温度 传感器 的 通信 网 络 


传感器 接口 为 一 个 关键 是 将 DTS 读数 传递 给 热管 理 模块 的 网 络 。 模 拟 和 数 
字 传 感 带 都 需要 此 网 络 。 对 于 数字 传 感 希 ， 每 个 单独 的 传 感 融 会 产生 一 个 本 地 的 
数字 输出 ， 然 后 将 其 传递 到 控制 /监控 模块 。 对 于 模拟 传 感 锅 ， 每 个 传感器 都 可 
以 配备 本 地 数字 转换 前 端 ， 或 者 多 个 模拟 传感器 后 端 共用 一 个 远程 的 数字 转换 前 
端 。 模 拟 传 感 器 的 另 一 种 可 能 的 实现 方式 是 在 热管 理 单元 的 子 组 件 中 完成 数字 转 
换 任务 。 

如 果 模 拟 传 感 融 没有 数字 前 端 ， 在 将 模拟 输出 传输 到 远程 温度 监控 和 管理 单 
元 时 ， 需 要 考虑 精度 问题 ， 在 3.1.1 节 中 已 描述 过 该 问题 。 正 如 我 们 前 面 讨论 
的 ， 采 用 四 线 测量 可 以 帮助 降低 由 热 变 化 引起 的 横 跨 电阻 网 络 的 电压 降 ， 而 由 四 
线 测量 网 络 携带 传感器 输出 。 此 外 ， 四 线 测量 中 的 互 连 大 小 可 以 不 同 ， 以 减轻 额 
外 的 电阻 降 和 屏蔽 噪声 [51 。 对 于 未 来 高 性 能 芯片 要 求 的 温度 传感器 数量 越 来 越 
多 的 需求 ， 进 行 多 层次 网 络 与 多 个 集 线 融 的 传感器 数据 采集 和 转换 可 能 是 一 种 解 
决 方案 。 此 外 ， 现 有 的 趋势 是 通过 混合 配置 不 同 大 小 的 模拟 和 数字 传感器 来 构建 
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精细 禾 盖 ， 并 平衡 传 感 右 的 足迹 和 路 由 开销 ， 以 及 平衡 模拟 与 数字 元 絮 件 的 
开销 。 

另 一 方面 ， 数 字 传 感 器 的 输出 接口 涉及 两 个 方面 。 首 先是 互 连 的 物理 结构 ， 
其 次 是 数据 传输 的 通信 协议 。 物 理 结 构 可 以 大 致 分 为 三 种 类 型 2 : DFE RE AGA 
管理 单元 之 间 的 点 对 点 通信 ; @ 利 用 测试 基础 设施 或 系统 总 线 ; @ 连 接 传感器 和 
管理 单元 的 专门 网 络 结构 。 对 于 最 后 一 种 结构 ， 有 不 少 新 兴 的 网 络 实现 方法 ， 除 
了 服务 于 温度 传感器 外 ， 该 网 络 服务 于 芯片 上 的 其 他 监控 设备 〈 例 如 ， 进 程 监 
控 、 关 键 路 径 监控 、 老 化 监控 ) US, 

英特尔 90nm Itanium 系列 处 理 需 中 早期 商用 的 DTM 采用 点 对 点 连接 ， 内 置 
在 每 个 计算 核心 中 的 浮 点 数 单元 和 整形 单元 的 温度 传感器 ADC 前 端 都 被 连接 起 
来 。 对 于 只 有 少量 传 感 需 的 早期 产品 而 言 ， 此 类 型 的 传 感 需 接口 是 唯一 可 行 的 部 
署 。 但 是 随 着 传感器 数量 的 增加 和 从 传感器 上 预期 采样 速率 的 提高 ， 更 加 结构 化 
的 接口 已 经 初 露 端倪 。 

早期 芒 片 传感器 的 接口 建议 将 温度 传 感 费 与 边界 扫描 芯片 功能 整合 到 一 
起 [2?1。 通 过 引入 额外 的 边界 扫描 指令 ， 读 出 电路 的 传感器 是 应 该 被 启用 还 是 应 
该 被 禁用 ， 同 时 对 芯片 温度 进行 持续 采样 。 另 一 个 建议 是 用 联合 测试 行动 小 组 
(JTAG) [2 访问 端口 (TAP)1?1。 接 入 电路 采用 边界 扫描 描述 语言 和 JTAG TAP 
操作 ， 它 们 采用 串 行 矢量 格式 [23] 。 

新 设计 中 传感器 通常 包括 一 个 品行 接口 ， 如 了 C、 系 统管 理 总 线 和 片上 外 设 
总 线 (OPB), ， 从 而 进行 传感器 与 甬 人 式微 控制 器 和 其 他 数字 系统 之 间 的 通 
信 !9] 。IBM POWER 架构 [2 布置 的 热 传 感 器 、 延 迟 传感器 ， 通 过 PCR 
行 总 线 驱 动 器 连接 。 可 寻 址 寄存 需 用 着 这 些 组 件 的 接口 。EC 总 线 是 常用 的 外 围 
设备 和 处 理 器 之 间 的 串 行 数据 线 接口 ， 其 通信 速度 在 100kbit/s ~ 3. 4Mbit/s 之 
间 。 一 个 专用 的 热 和 电源 管理 微 控 制 器 通过 自 带 的 高 速 工 C 总 线 接口 与 传感器 通 
ffo EEE, Æ Power7 its HP, PC 接口 用 于 连接 温度 传感器 。Power7 为 了 降低 
通信 开销 而 引入 了 附加 功能 。 中 介 事 务 表 定 期 从 芯片 周 于 收集 热 传 感 需 数据 。 一 
且 某 一 区 块 传感器 数据 的 最 新 设置 被 确定 下 来 ， 一 个 用 于 散热 和 电源 管理 的 微 控 
制 器 就 可 以 调 取 单独 的 工 C 信号 输出 。 

英特尔 开发 的 系统 管理 总 线 串 行 接口 也 兼容 下 C。 放 置 在 高 性 能 芯片 中 的 远 
程 模拟 传感器 可 以 利用 接口 将 读数 传输 到 热 监控 世 片 ， 并 随后 进行 转换 与 
Ay py 24 251 5 

FPGA obs Fr P6 -29? poit HE [c AS a 6 HH EIR AME Je VR I, PIR 
器 中 有 时 间 到 温度 或 脉冲 到 温度 前 端 。 它 们 利用 如 OPB 通信 通道 等 接口 (30]。 
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OPB 总 线 与 处 理 器 本 地 总 线 通过 一 个 连接 桥 将 PRGA 上 的 和 恋人 入 式 处 理 器 在 与 忆 片 
上 所 有 的 其 他 外 设 接口 相连 接 。 在 FPGA 硬件 实现 方面 ，OPB 规范 地 采用 了 分 布 
HZ ih FARE 

基于 总 线 的 通信 ， 使 传感器 更 容易 集成 到 现 有 的 通信 基板 上 ， 并 且 与 通信 协 
议 保持 良好 的 兼容 性 。 然 而 ， 随 着 片上 传感器 数量 的 增多 ， 它 的 扩展 性 问题 成 了 
一 个 主要 问题 ， 特 别 是 随 着 越 来 越 多 的 各 种 片上 传感器 的 出 现 ， 它 们 将 持续 反映 
芯片 的 物理 事件 ， 如 温度 、 汇 漏 、 延 迟 、 电 压 跌落 状态 、 电 流 。 为 了 应 对 这 种 不 
断 增长 的 需求 ， 最 近 的 学 术 研究 中 已 经 研究 了 专门 用 于 收集 传感器 数据 的 NoC 
结构 。 

在 一 个 较 早期 提议 中 ， 专 用 NoC 片上 传感器 网 络 支 持 两 种 类 型 物理 监测 的 
片上 通信 : 温度 传感器 监测 和 关键 路 径 延 时 监测 [31,2]。 它 的 目的 是 通过 监控 执 
行 处 理 器 对 SoC 芯片 进行 监控 ， 通 过 温度 动态 感知 控制 系统 的 频率 。 网 络 采用 不 
规则 网 格 拓 扑 结 构 ， 以 适用 芯片 上 监控 设备 的 不 规则 布局 。 它 由 多 路 复 用 器 、 总 
线 线段 和 路 由 器 组 成 。 低 带宽 监测 设备 (如 温度 传感器 ) 通过 多 路 复 用 器 连接 
到 总 线段 ， 而 更 高 带宽 的 传感器 则 直接 连接 到 路 由 器 端口 。 它 采用 了 一 种 复杂 度 
较 低 的 路 由 协议 ， 每 个 路 由 器 都 有 一 个 静态 路 由 表 。 与 传统 的 数据 通信 NoC 相 
比 ， 路 由 器 经 过 了 区 域 优化 ， 结 构 关系 也 相对 简单 。 路 由 器 包含 4 个 输入 缓冲 
区 ， 具 有 8 位 数据 宽度 。 每 个 单独 路 由 器 端口 的 数目 是 由 一 个 给 定 的 不 规则 拓扑 
确定 的 。 

另 一 个 针对 温度 传感器 的 NoC 提议 是 通过 观察 数据 流 的 主要 操作 模式 ， 从 
而 达到 优化 网 络 复杂 性 的 目的 ， 它 是 单 向 的 [3] 。 树 拓扑 结构 已 被 用 于 此 类 NoC, 
路 由 器 在 中 央 控 制 单元 根部 的 中 间 节 点 。 为 了 提高 网 络 内 的 容错 能 力 ， 在 对 节点 
间 插 入 一 个 额外 的 双向 链 路 。 该 研究 探讨 了 一 系列 路 由 器 组 态 ， 标 识 4 位 数据 宽 
度 和 一 个 四 进入 路 由 需 缓冲 区 作为 合理 的 设计 选择 。 路 由 需 不 使 用 任何 LUT， 因 
为 (无 故障 ) 数据 流 是 单 向 的 流向 一 个 目的 地 。 图 3.6 给 出 了 这 两 NoC 配置 的 
基本 结构 。 图 3. 6a 描述 了 一 个 附 在 热 监 测 单元 的 不 规则 网 状 结构 ， 图 3. Ob 描绘 
了 一 个 树 形 结构 。 

在 新 兴 的 高 性 能 芯片 上 ， 其 他 的 监控 设备 与 温度 传感器 共同 布置 ， 如 电流 和 
延 时 传感器 等 。 新 提出 的 一 种 NoC 的 结构 ， 可 以 服务 于 包括 温度 传感器 在 内 的 
众多 的 片上 传感器 :”。 这 种 网 络 引 入 了 阅 值 的 概念 ， 在 网 络 传 递 的 过 程 中 传 感 
器 的 输出 经 过 处 理 和 部 分 消除 ， 只 有 最 相关 的 子 集 才 可 到 达 最 终 目 的 地 ， 也 就 是 
中 央 监 探 单元。 具体 而 言 ， 事 先 定义 传感器 的 阔 值 ， 只 有 当 那 些 传感器 输出 超过 
该 阔 值 才 人 允许 通过 网 络 传播 。 共 享 数据 信道 在 多 个 监视 器 之 间 进 行 时 间 复 用 。 此 
外 ， 不 像 前 面 描述 的 其 他 网 络 ， 传 感 器 的 输出 被 假定 为 模拟 信号 ， 它 们 将 在 中 央 
单元 被 数字 化 。 网 络 后 端 负责 为 每 个 监视 器 分 配 一 个 单 周 期 时 际 ， 并 通过 确认 信 
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图 3.6 片上 温度 传 感 咒 网 络 两 种 架构 的 示意 图 
a) 连 向 中 心 热管 理 单元 的 网 状 结构 b) 树 状 结构 ， 同 级 路 由 器 之 间 有 直接 互 连 ， 
传感器 连接 到 叶 端 ， 热 管理 单元 和 根部 路 由 器 相连 


号 确定 与 特定 单个 监视 器 进行 通信 的 开始 时 间 。 图 3.7 显示 了 通过 共享 信道 携带 
模拟 传感器 信号 的 网 络 整体 结构 。 


传感器 

v 
传感器 数据 | MBA 
| “信号 

热管 理 单元 


图 3.7 专门 温度 传感器 时 间 复 用 网 络 中 的 重要 组 件 和 信号 


之 前 回顾 的 网 络 结构 都 是 建立 在 同步 的 基础 上 。 一 种 新 的 自 定时 的 通信 网络 
传感器 也 被 提出 ;23] 。 选 择 此 种 架构 的 背后 基本 原理 是 使 传感器 可 以 针对 突然 热 
事件 ， 立 即 执行 控制 机 制 。 虽 然 大 多 数 的 热 事 件 需 要 一 个 足够 大 的 时 间 尺 度 ， 很 

可 能 会 大 于 采样 周期 , 但 是 自 定时 的 通信 网 络 工作 仍 是 一 个 有 趣 的 概念 。 该 网 络 
是 一 个 星 形 互连网 络 ， 从 每 个 传感器 到 中 央 处 理 单元 都 有 点 至 点 的 通道 。 它 在 各 
传感器 和 中 央 监 控 单 元 之 间 采 用 两 信号 握手 协议 。 两 位 编码 数据 将 整个 操作 温度 
范围 分 成 四 个 区 域 ,通过 改变 四 根 导 线 中 任意 一 根 的 信号 来 标示 温度 对 应 的 
区 域 。 
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3.2 工业 设计 中 基于 温度 传感器 的 动态 功 耗 和 热管 理 


本 节 中 ， 我 们 将 首先 介绍 在 工业 设计 采用 的 DIM R, DTM 系统 中 有 温度 
传感器 的 反馈 回路 。 接 下 来 将 讨论 学 术 研 究 的 一 个 例子 。 在 商业 芯片 的 DTM "P, 
大 多 数 是 以 芯片 温度 传感器 反馈 的 芯片 温度 为 驱动 的 因素 。 某 些 系 统 还 以 板 载 传 
感 器 作为 第 二 输入 。 例 如 ， 英 特 尔 至 强 协 处 理 器 采用 板 级 温度 传感器 报告 进 气 和 
排 气温 度 ， 还 有 一 个 传感器 放置 在 GDDR 5 内 存世 片 附近 。 图 3.6 说 明了 现代 处 
理 器 中 DTM 系统 的 一 部 分 及 其 相互 作用 。 一 个 专门 的 模块 (热管 理 单元 ) 负责 
收集 温度 传感器 数据 和 对 管理 行为 做 出 决定 。 这 个 模块 可 以 被 集成 到 处 理 器 内 核 
中 或 作为 一 个 专用 的 微 控 制 器 来 使 用 。 图 3. 8 描述 了 这 两 个 选项 。 
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图 3.8 DTM 中 主要 部 件 示意 氏 


3.2.1 第 一 代 动 态 热管 理 


动态 功率 和 热管 理 方案 早期 应 用 在 一 些 产品 的 例子 ， 如 英特尔 奔腾 4、IBM 
的 PowerPC 和 AMD 的 速 龙 系列 处 理 器 [5 7351 。 由 热 二 极 管制 成 的 模拟 温度 传 感 
器 用 来 给 这 些 早期 的 控制 方案 提供 温度 数据 反馈 。 

最 早 实现 DTM 的 英特尔 处 理 器 创建 了 空 载 时 间 用 来 应 对 紧急 热 状 况 ， 以 使 
芯片 得 到 冷却 55.3] 。 将 片 内 温度 传感器 的 测量 值 与 厂 内 校准 的 最 高 温度 阔 值 进 
行 比较 。 最 高 温度 冰 值 被 称 为 Tieuim 或 Ts， 它 代表 必 片 允许 最 高 温度 。 实 际 
传感器 报告 的 是 芯片 温度 和 Tiweum 温 度 的 差 值 ， 差 值 可 以 是 一 个 正 数 或 0。 如 果 
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差 值 是 0 或 非常 接近 于 0， 将 会 触发 热管 理 系统 。 另 一 个 极端 情况 ， 当 差 值 小 于 
某 一 个 最 小 值 (大 约 在 安全 温度 以 下 20% ) ， 传 感 器 的 温度 输出 将 会 降 到 最 低 
值 ， 直 到 温度 上 升 到 足够 高 才 可 再 一 次 更 新 温度 传感器 的 读数 。 

系统 可 以 处 在 上 述 两 种 模式 中 的 一 种 。 如 果 温 度 没 有 超过 阔 值 ， 则 系统 运行 
在 最 大 时 钟 频率 ;如 果 超 过 温度 阔 值 ，PROCHOTY# 信 和 号 会 激活 热 控制 系统 。 在 这 
种 情况 下 ， 系 统 的 时 钟 停止 在 一 个 预先 定义 的 频率 ， 直 到 芯片 温度 低 于 姜 值 ， 
PROCHOT# 信 号 才 会 被 消除 。 最 后 ， 如 果 发 生冷 却 故 障 或 其 他 意外 的 情况 时 ， 处 
理 器 温度 会 不 断 上 升 并 超过 预先 定义 的 Ts ,wi。,。 这 表明 管理 系统 不 能 将 芯片 温 
度 控 制 在 安全 极限 以 下 。 实 际 的 实现 可 能 会 有 所 不 同 ， 但 这 种 灾难 性 的 温度 点 在 
T maion £200C 以 上 。 它 会 触发 所 谓 的 THERMTRIP # 状 态 ， 系 统 会 关闭 内 部 时 钟 ， 
直到 处 理 吉 的 温度 降下 来 。 

这 种 热管 理 机 制 被 称 为 热 监 视 器 1 (TMI), ， 可 以 认为 它 是 第 一 代 英 特 尔 
DTM 系统 。 当 这 项 功能 被 启用 时 ， 可 以 在 硬件 控制 下 自动 运行 。 然 而 ， 它 也 可 
以 由 操作 系统 通过 设置 一 个 特定 的 寄存 器 来 启用 或 禁用 ， 通 过 高 级 配置 和 电源 接 
口 完成 该 操作 。 它 可 以 在 运行 时 由 操作 系统 启用 ， 这 个 模式 还 允许 在 更 大 范围 内 
配置 时 钟 占 空 比 。 这 种 使 用 方式 被 称 为 按 需 管理 。 无 论 哪 种 管理 模式 ( 自动 或 
需求 ) ， 时 钟 被 持续 禁用 时 间 的 长 度 tun 被 限制 在 3ps。 保持 3ps 时 间 间 隔 恒定 ， 
而 所 需 的 占 空 比 是 通过 修改 持续 时 间 1 来 实现 ，i 代 表 该 时 钟 活跃 时 间 。 由 此 
产生 的 占 空 比 可 通过 下 式 表示 : 


t 
- on 3.3 
a t o + lore ( ) 
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一 项 关于 门 控 时 钟 周 期 和 触发 降 频传 感 器 附近 功率 密度 之 间 关 系 的 研究 表 
明 ， 在 传感器 附件 的 功率 密度 是 一 个 周期 为 i etu HUE! 。 由 功率 密度 变化 
所 产生 温度 波动 的 振幅 Ar 可 以 近似 表示 为 [401 


= m 
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tor 长 度 的 选择 涉及 两 个 因素 。 一 方面 ， 温 度 的 摆动 应 该 足以 使 温度 处 于 安 
全 极限 范围 内 。 然 而 ， 这 不 应 导致 过 度 的 性 能 退化 。 一 般 希 望 系 统 工作 在 满 计算 
负荷 时 ， 只 略微 低 于 温度 限制 ， 如 此 最 高 功率 和 性 能 可 同时 满足 要 求 。 另 一 方 
面 ， 持 续 时 间 应 该 足够 长 ， 确 保 传 感 器 可 以 捕捉 到 新 的 热 状 态 。 大 量 的 试验 研究 
表明 几 个 微 秒 足以 在 实践 中 实现 此 目的 。 

早期 IBM 的 PowerPC 系列 处 理 器 使 用 了 TAU， 它 可 以 工作 在 两 种 模式 
REY 可 以 将 芯片 上 传感器 报告 的 结 温 与 一 个 或 两 个 阅 值 进行 比较 。 这 样 就 可 
以 在 单 步 干 预 和 两 步 干预 之 间 做 出 选择 。 阅 值 温 度 事先 用 程序 写 入 专用 寄存 器 
内 ， 并 与 测量 到 的 温度 进行 比较 。 当 温度 超过 靖 值 时 ， 会 产生 一 个 中 断 信 号 ， 它 
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引导 处 理 器 对 指令 高 速 缓存 读 取 速 率 进行 降 频 。 在 系统 的 一 些 变 化 中 ， 监 控 系 统 
也 会 使 用 片 外 监控 处 理 器 ， 它 与 处 理 器 芯片 上 热 二 极 管 通信 ， 并 利用 一 个 额外 的 
桥接 芯片 [4 通过 PC 总 线 发 送 必要 的 中 断 干预 。 


3.2.2 第 二 代 动 态 热管 理 


结合 各 种 电源 管理 方法 ， 这 些 早期 的 DIM 已 扩展 到 新 的 芯片 族 中 。 随 着 时 
间 的 推移 ， 芯 片 生产 商 也 开始 针对 特定 领域 定制 动态 管理 技术 ， 包 括 手机 、 平 板 
电脑 和 服务 器 。 巾 此 催生 了 第 二 代 DTM 方法 ， 在 接 下 来 的 章节 中 将 会 介绍 第 二 
代 DTM 方法 。 
3.2.2.1 英特尔 速度 分 阶 技术 

英特尔 奔腾 M 处 理 器 是 在 移动 领域 实现 更 高 效率 一 个 例子 .1。 第 二 代 DTM 
机 制 又 被 称 为 热 监控 系统 2 (TM2) ， 在 奔腾 M 系列 处 理 器 中 也 有 应 用 。TMI1 只 
在 很 短 间隔 内 根据 工作 循环 的 时 间 表 禁用 时 钟 ， 而 TM2 负责 响应 热 事 件 并 实现 
动态 电压 和 频率 缩放 。 类 似 于 TM, TM 有 两 种 模式 : 基于 硬件 的 自动 模式 和 
基于 软件 的 按 需 模式 。 

奔腾 M 处 理 器 芯片 采用 了 两 个 不 同类 型 的 传感器 : 一 个 热 二 极 管 和 一 个 
DTS。 热 二 极 管 工 作 在 远程 模式 ， 换 而 言 之 ， 只 有 后 端 驻 留 芯片 上 。 它 的 输出 被 
中 继 到 外 部 芯片 ， 并 通过 专用 引 脚 转换 。 该 传感器 的 任务 是 向 操作 系统 报告 节 
温 。 第 二 传感器 为 DTS， 它 是 与 芯片 管理 机 制 的 接口 。 

当 DTS 信号 表示 芯片 温度 超过 阔 值 时 ， 热 管理 机 制 至 少 启用 一 段 时 间 
(lms) 。 时 钟 频 率 首先 改变 。 锁 相 环 电 路 (PLL) 被 锁定 在 新 的 频率 水 平 上 。 这 
种 转变 发 生 在 几 微 秒 内 ， 因 此 处 理 器 的 执行 不 中 断 。 一 旦 频率 稳定 ， 电 压 以 大 约 
I1mV/ ps 的 速度 降低 到 与 频率 相应 的 电压 值 。 具 体 实现 技术 可 能 有 些 变化 。 一 种 
方法 是 设 有 配对 (如 频率 、 电 压 ) 列表 ， 并 从 一 个 逐步 转换 到 另 一 个 。 每 个 
(频率 ， 电 压 ) 配对 也 被 称 为 P 状 态 。 英 特 尔 的 电源 和 热管 理 系统 定义 了 几 个 了 
状态 (5 个 状态 ) ， 最 高 性 能 状态 被 命名 为 PE ，P1 是 下 一 级 性 能 状态 。 通 常 通过 
硬件 采样 一 次 降低 的 频率 和 电压 一 个 状态 序列 。 还 有 一 个 序列 状态 被 称 为 C 状 
态 ， 对 应 于 不 同 配置 的 空 载 状态 。 处 于 睡眠 模式 的 C 状态 根据 子 组 件 的 不 同 而 
变化 (例如 ， 只 有 缓存 处 于 休眠 状态 ， 而 不 是 计算 核心 和 缓存 都 处 于 休眠 状 
态 ) 。 

热管 理 启 动 期 间 ，DTS 不 断 报告 温度 ， 管 理 系 统 可 以 推断 其 是 否 可 有 效 地 降 
低 芯片 温度 ， 并 保持 低 于 阔 值 。 如 果 能 很 快 实现 ， 热 管理 机 制 可 以 在 lms 后 停 
止 。 另 一 方面 ， 尽 管 在 最 低 点 〈 如 频率 ， 电 压 ) 运行 ， 芯 片 温度 仍 将 继续 上 升 ， 
可 能 的 原因 是 系统 故障 或 冷却 冷却 失效 等 。 如 同 TMI 方法 一 样 ， 此 时 会 将 处 理 
器 置 于 停机 模式 。 同 理 ， 如 果 当 前 温度 和 最 大 节 温 之 间 差 距 很 大 ， 处 理 吉 的 频率 
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和 电压 可 以 增加 ， 以 达到 优化 性 能 的 目的 。 

结合 第 一 代 和 第 二 代 热 监测 方法 ,动态 功率 和 热管 理 方案 被 称 为 速度 分 阶 技 
术 。 其 基于 硬件 的 自我 览 挖 和 自我 降 频 ， 并 辅 以 软件 级 优化 。 当 片上 监视 器 跟踪 
数字 传感器 时 ， 热 二 极 管 的 输出 由 外 部 A -DD 转换 芯片 转换 ， 其 数字 输出 可 以 通 
过 ACPI 获得 。 操 作 系 统 利用 结 温 信 息 来 实现 按 需 功率 优化 方案 ， 该 方案 称 为 基 
于 需求 的 交换 连接 (DBS) 。 当 DBS 辨别 出 可 以 降低 利用 率 ， 它 会 降低 一 级 了 AR 
态 。 当 工作 量 增加 时 ， 它 提升 P 状态 以 满足 需求 。 在 软件 层 ， 更 复杂 的 自 定义 
电压 和 频率 缩放 算法 也 可 以 实现 在 较 粗 的 粒度 级 别管 理 芯 片 的 功率 和 热 状 态 。 基 
于 硬件 的 监视 器 ， 在 软件 层 起 作用 之 前 ， 负 责 迅 速 响应 突然 变化 和 故障 。 
3.2.2.2 英特尔 的 Foxton 技术 

另 一 个 早期 专业 的 热管 理 例子 是 英特尔 的 Foxton 技术 [3 ,41 。90nm 双核 处 
理 器 系列 采用 专门 的 对 入 式微 控制 器 作为 芯片 上 模拟 传感器 的 接口 。 监 控 系 统 是 
一 个 离散 的 时 间 控 制 系统 。 它 可 以 在 固定 模式 下 运行 。 电 压 和 频率 固定 ， 无 须 动 
态 管 理 。 它 也 可 以 运行 在 动态 管理 模式 ， 微 控制 器 能 够 执行 三 种 不 同 的 程序 : 电 
源 、 温 度 和 校准 。 这 些 程序 以 预先 定义 的 时 间 间 隔 (8ps) 进行 实时 调用 。 该 系 
统 采用 四 个 温度 传 感 右 ， 且 传感器 位 于 泽 点 和 整数 单元 。 温 度 传 感 锅 是 由 正 向 侦 
置 二 极 管 结 和 恒定 电流 源 组 成 ， 具 有 - 1. 7mV/C 的 近似 温度 系数 。 模 拟 传感器 
通过 与 位 于 Foxton 单元 附近 的 ADC 多 路 复 用 器 连接 。ADC 与 电压 测量 单元 和 其 
他 管理 及 相关 校准 信和 号 共享 ， 同 时 也 需要 考虑 微 控制 器 。 单 片 机 监控 芯片 的 电流 
消耗 。 通 过 测量 一 个 功率 层 电阻 的 电流 和 总 功率 ， 间 接 完成 电压 的 测量 。 

从 远程 模拟 传 感 带 后 端 到 中 心 ADC 前 端的 走 线 需要 周密 的 计划 ， 以 避免 电 
阻 带 来 的 沿线 电压 降 和 沿线 耦合 噪声 。 在 本 章 前 面 已 讨论 过 这 一 点 的 重要 性 。 

电源 和 温度 管理 系统 运行 的 目标 是 最 大 限度 地 提高 性 能 ， 同 时 保证 温度 和 功 
率 在 规定 的 范围 内 。 英 特 尔 处 理 器 系列 功 耗 约 100 ~ 130W 之 间 。 系 统 被 配置 为 
不 允许 芯片 温度 超过 90%C 。 在 每 个 电源 例 行 程序 中 ， 监 测 系 统 把 电流 测量 转换 
为 功率 测量 。 一 个 闭环 控制 系统 确定 下 一 个 时 刻 芯片 的 电压 水 平 ， 使 系统 停留 在 
一 个 定义 的 目标 参考 功率 范围 内 。 系 统 以 12. 5mV 的 步 长 降 将 电压 分 成 32 级 。 
产生 的 电压 水 平 传递 到 子 系统 ， 子 系统 生成 时 钟 频率 决定 了 电压 水 平 所 对 应 的 时 
钟 频 率 !$5] 。 有 64 个 可 用 的 频率 级 别 。 温 度 回 路 从 ADC 采集 实际 传感器 的 读数 ， 
并 与 靖 值 进行 比较 。 如 果 管 理 系 统 决定 介入 一 个 热 紧 急 情况 ， 它 会 规定 一 个 电压 
水 平 的 上 限 。 最 后 ， 校 准 程序 是 只 能 校准 电压 测量 ， 不 涉及 传感器 的 标定 。 如 上 
所 述 ，Foxton 技术 可 以 用 纯 硬 件 驱 动 模式 ， 让 操作 系统 在 DBS 模式 访问 和 执行 。 
3.2.2.3 IBM 的 EnergyScale 技术 

IBM 在 其 双核 Power6 处 理 器 !21 上 引入 了 EnergyScale 技术 来 进行 动态 功率 和 
热管 理 。 这 个 系统 ， 类 似 于 Foxton。 它 利用 一 个 特殊 的 微 控 制 器 [其 命名 为 散热 


第 3 章 “动态 热管 理 


和 电源 管理 装置 (TPMD) ] 进行 芯片 上 的 热管 理 ， 而 不 是 基于 一 个 纯粹 的 软件 
控制 ， 从 而 保证 系统 能 较 快 的 响应 热 事 件 。 

两 种 温度 传感器 可 在 处 理 器 上 使 用 ， 它 通过 工 C 总 线 和 TPMD 通信 。 一 组 将 
模拟 芯片 上 的 热 敏 传感器 作为 热 敏 电阻 实现 。 热 敏 传感器 被 校准 为 线性 依赖 于 温 
度 的 电阻 。 电 阻 由 通过 电阻 的 电流 和 其 两 端的 恒定 的 已 知 电压 求 得 ， 并 最 终 转换 
为 温度 读数 。 在 双核 芯片 上 ， 在 每 个 磁 芯 上 放置 一 个 热 敏 电阻 ， 并 在 芯片 中 心 附 
近 放 置 另 一 个 热 敏 电阻 。 处 理 器 需 包 含 传感器 的 专用 引 脚 ， 以 实现 将 电流 测量 值 
传输 到 芯片 外 的 ADC。Power6 是 一 个 具有 增强 和 细 粒 度 芯 片 内 置 温度 传感器 的 
现代 处 理 器 示例 。 为 了 实现 这 一 点 ， 总 共有 24 个 数字 温度 传感器 (每 个 核心 有 
8 个 ， 另 有 8 个 布置 在 其 他 地 方 ) 放置 在 芯片 中 。 为 了 实现 基于 硬件 的 热管 理 系 
统 ， 这 些 传感器 可 被 直接 访问 。 数 字 传 感 器 通过 环形 振荡 器 实现 温度 监控 ， 通 过 
测量 在 一 段 固定 时 间 内 振荡 的 次 数 可 以 得 到 温度 和 振荡 速度 之 间 的 依赖 关系 。 由 
于 芯片 采用 动态 变化 的 电压 和 频率 模式 ， 其 供给 水 平 会 大 幅 波动 。 因 此 ， 环 振荡 
器 经 过 优化 设计 ， 要 能 满足 电压 不 断 变化 的 要 求 。 

数字 传感器 通过 专门 的 网 络 将 振荡 次 数 报告 到 特殊 的 系统 寄存 器 。 因 此 ， 双 
模式 操作 的 实现 类 似 于 其 他 上 述 处 理 器 的 例子 。 芯 片上 的 温度 监控 机 制 提供 反馈 
给 TPMD, ， 并 且 接 收 从 功率 和 热管 理 微 控 制 器 发 出 的 指令 来 补救 过 热 的 紧急 情 
况 。 为 了 完成 这 一 任务 ，TPMD 执行 实时 艇 和 人 式 操 作 系统 ， 轮 询 传感器 信息 ( 模 
拟 和 数字 传感器 ) 并 做 出 管理 决策 。 同 时 ， 处 理 器 的 操作 系统 也 可 以 读 取 TPMD 
的 数据 。 

TPMD 执行 所 谓 的 热 上 限 方案 。 有 两 种 可 供 选 择 的 具体 热管 理 方案 : 线程 
管道 降 频 和 频率 缩放 。 这 些 选 项 可 单独 使 用 也 可 结合 使 用 。 当 TPMD 检测 到 芯片 
温度 已 达到 临界 水 平 ， 它 会 引导 和 硬件 来 减少 内 核 运 行 的 线程 调度 率 。 当 传感器 报 
告 的 温度 低 于 安全 水 平 后 ， 调 度 速率 可 以 恢复 到 活跃 的 速率 。 第 二 个 可 供 选 择 的 
方案 是 基于 时 钟 频率 的 降 频 和 配置 相应 的 设置 电压 。 


3.2.3 最 新 一 代 动 态 热 管理 


最 新 一 代 的 动态 热 监测 方法 一 个 标志 是 在 实践 中 广泛 使 用 芯片 内 置 的 数字 温 
度 传 感 器 〈 前 端 和 后 端 都 在 芯片 上 ) 。 例 如 ，IBM 的 8 核 Power7 Wh IE ak AIH T 
44 个 数字 传感器 3 4] 。 在 默认 情况 下 ， 每 个 单独 的 芯片 温度 传感器 都 会 在 工厂 
被 校准 。 因 为 处 理 器 在 批量 生产 时 ， 个 体 之 间 存 在 巨大 的 差异 ， 需 要 针对 每 个 独 
立 的 温度 传感器 进行 校准 。 最 新 一 代 处 理 融 的 另 一 个 重要 特征 是 涡轮 增 压 模 
式 ![1 的 使 用 ， 它 会 引入 另 一 种 高 于 名 义 频率 的 模式 。 当 系统 的 功率 和 热 有 足够 
余 量 时 ， 可 提高 系统 的 性 能 。 比 如 ，AMD 处 理 器 引入 了 两 个 新 功能 ， 名 为 HY 
加 速 和 可 配置 TDP。HY 加 速 利用 忆 乒 温度 反馈 控 决 定 启 动 涡轮 增 压 状态 的 时 
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机 。 热 状态 提供 底层 芯片 的 最 准确 的 状态 ， 用 于 获知 在 芯片 达到 目标 TDP 时 的 

热 余 量 。 
最 后 ， 无 论 是 被 动 散热 器 冷却 还 是 基于 有 源 风 扇 冷 却 的 处 理 器 ， 它 们 的 热 监 

测 都 会 被 应 用 到 冷却 系统 控制 中 。 受 控制 的 主动 冷却 已 成 为 芯片 热 监控 系统 管辖 

的 一 部 分 。 

3.2.3.1 IBM Power7 和 Power8 的 热管 理 

IBM 在 新 的 处 理 器 部 署 了 加 强 版 的 EnergyScale 技术 ， 采 用 专用 微 控制 吉 
(名 为 EnergyScale 微 控制 器 ) 进行 功率 和 热 4 控制 。 总 共 44 个 传感器 分 布 在 8 
个 核心 〈 每 个 核心 5 个 ) 和 外 围 〈 剩 余 的 4 个 传感器 ) 。 同 前 述 技 术 相 比 ， 一 个 
明显 的 差异 是 这 些 传感器 需 经 过 更 深入 的 校准 。 每 个 传感器 的 读 值 都 经 过 进一步 
处 理 ，EnergyScale 微 控制 器 通过 二 次 多 项 式 将 读 值 映 射 成 最 终 的 温度 值 。 多 项 
式 的 配置 被 存储 在 固件 中 。 在 工厂 中 ， 每 个 传感器 都 和 参考 热 二 极 管 都 要 进行 对 
比 校 验 ， 校 验 的 温度 范围 设 定 为 实际 工作 的 温度 范围 CB 65 ~ 85C ) 。 

应 对 突 发 事件 的 电源 管理 决策 也 需要 基于 从 传感器 得 到 的 热 反 馈 (如 动态 
频率 和 电压 缩放 ， 激 活 节 流 ) 。 较 上 一 代 处 理 器 ， 新 一 代 的 电源 管理 策略 有 明显 
的 进步 ， 它 可 以 缩放 每 个 单独 的 核心 频率 。Power7 利用 分 数 数字 PLL 为 每 个 核 
心 提 供 了 一 个 专用 的 频率 发 生 器 。 每 个 发 生 右 使 用 一 个 数字 控制 振荡 器 ， 用 于 创 
建 一 个 参考 时 钟 数 的 倍数 。 处 理 器 的 最 新 成 员 Power8, dé 22nm 工艺 下 的 12 核 
处 理 器 ， 它 同样 使 用 了 一 个 芯片 内 的 控制 器 ， 执 行 类 似 的 电源 和 热管 理 服 
BLAT) 。 最 新 一 代 动 态 管理 系统 的 最 显著 特点 是 ， 将 回路 执行 的 时 间 控 制 1ms 以 
F, 而 在 Power7 中 回路 执行 时 间 需 要 32ms , 
3.2.3.2 英特尔 的 至 强 和 酷 寄 系 列 

45nm 英特尔 至 强 处 理 器 [3,43] 和 22nm 英特尔 酷 害 系列 处 理 器 [ a 在 每 一 个 
核心 上 布置 一 个 数字 温度 传感器 ， 且 传感器 经 过 工厂 校准 。 与 前 几 代 一 样 ， 传 感 
器 报告 温度 和 最 高 国人 值 温度 了， 之 间 的 差 值 。 在 无 热 应 力 的 情况 下 ， 传 感 器 报 
告 一 个 负 值 。 当 温度 和 Tu 之 间 的 差 值 为 0 时 ， 触 发热 二 极 管理 。 同 以 前 的 设 
计 相 比 ， 此 系统 的 一 个 改进 之 处 在 于 提升 了 触发 PROCHOT # 状 态 和 热 节 流 极限 
温度 的 设计 。 它 有 助 于 应 对 不 同 处 理 器 中 不 同 的 热管 理 触发 温度 极限 ， 可 以 向 终 
端 用 户 提供 更 统一 的 热管 理 。 例 如 ， 一 个 重要 的 问题 是 冷却 风扇 的 噪声 影响 。 如 
下 将 进行 简短 的 讨论 ， 芯 片上 的 传感器 温度 读数 被 用 来 控制 风扇 速度 。 在 不 同 的 
处 理 器 上 的 风扇 速度 控制 会 导致 完全 不 同 的 声学 效果 。 

相 比 奔腾 M 系列 ，PROCHOT# 信 和 号 做 了 修改 ， 更 加 适应 管理 多 个 核心 的 需 
求 。 在 新 的 应 用 中 ， 它 被 转化 为 一 个 双向 信号 。 当 热 紧急 事件 由 芯片 上 的 一 个 特 
定 核心 传感器 触发 时 ， 触 发 信号 引起 的 性 能 下 降 倾向 于 只 发 生 在 相应 的 核心 内 。 
外 部 实体 调用 的 PROCHOT # 降 频 则 会 作用 于 整个 芯片 。 
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对 于 特定 的 热管 理 方案 而 言 ， 传 感 器 具有 一 个 能 人 式 热 管理 电路 接口 ， 它 和 
传 感 带 一 起 统称 为 DTS 电路 。 它 们 是 由 一 个 微 控制 器 电路 和 时 钟 控 制 右 组 成 。 
自主 的 硬件 单元 可 以 执行 两 种 管理 方案 ， 分 别 是 前 面 介绍 过 的 奔腾 4 和 奔腾 M 
SbF AS A PAY TM 和 TM2 方案 。 另 外 ， 类 似 上 一 代 世 片 ，THERMALTRIP# 信 
号 用 于 表示 处 理 右 的 节 温 温 已 经 达到 安全 极限 ， 它 可 能 是 由 于 局 部 热 失控 或 冷却 
失效 造成 的 。 针 对 这 一 事件 的 关机 过 程 将 启动 ， 先 停止 内 部 钟 ， 下 一 步 禁 用 核心 
电压 稳 压 器 。 

在 软件 层面 ， 基 本 输入 输出 系统 (BIOS) 可 以 启用 或 禁用 TMI 和 TM2 J 
案 。 对 于 系统 级 管理 ,平台 环境 控制 接口 (PEC) 用 来 将 热 状态 传递 给 软件 系 
统 。PECI 是 英特尔 专 有 接口 ， 提 供 处 理 器 、 芯 片 组 件 与 外 部 热 监测 设备 之 间 的 
通信 信道 。PECI 本 质 上 是 一 个 处 理 器 和 软件 层 之 间 的 桥 粱 。 如 前 几 代 一 样 ， 数 
字 传 感 器 输出 存储 在 特殊 的 MSR 寄存 器 中 。PECI 通过 额外 的 处 理 来 计算 出 核心 
的 平均 温度 。 当 PECI 访问 所 有 数字 传感器 输出 时 ， 软 件 只 能 访问 记录 最 高 温度 
的 寄存 器 。 单 个 MSR 也 可 以 通过 软件 的 特殊 指令 读 取 ， 用 于 定制 高 级 的 功率 和 
热管 理 方案 。 也 有 各 种 第 三 方 工具 来 读 取 这 些 值 ， 如 基于 Windows 的 Real Temp 
和 基于 Linux 的 Kernel Module Core Temp。 

随 着 心 片 核 数 的 增加 以 及 对 应 的 温度 传感器 数量 的 增加 ，PECI 系统 的 物理 
结构 已 被 修改 ， 以 提高 系统 的 可 扩展 性 。 传 感 器 网 络 可 为 层次 结构 。 例 如 ， 每 个 
槽 可 以 构成 一 个 域 ， 一 个 模 也 可 以 内 部 划分 为 多 个 域 。 每 个 域 表示 域 中 最 热 核心 
传感器 报告 的 最 高 温度 值 。 每 个 域 可 以 通过 PECI 单独 调用 。PECI 系统 的 输出 也 
被 用 来 控制 冷却 风扇 的 转速 。 当 PECI 报告 的 温度 在 Tu LA FEE, Us Fe BE n] 
以 降低 以 改善 声学 和 降 频 。 一 旦 触发 PROCHOT # 信 号 时 ， 系 统 风扇 会 全 速 启动 。 
3.2.3.3 至 强 Phi 协 处 理 器 的 热管 理 

英特尔 至 强 Phi 协 处 理 器 作为 第 一 代 多 核 世 片 ， 是 我 们 讨论 商用 处 理 器 
DTM 机 制 的 最 后 一 个 例子 :551 。 通 过 此 系统 可 表明 片上 热 传 感 器 与 额外 的 板 上 热 
传感器 共同 作用 完成 系统 级 管理 。 响 应 芯片 温度 升 高 的 主 控制 旋钮 是 系统 中 的 频 
率 缩放 。 协 处 理 器 芯片 包含 61 个 核心 ， 每 一 个 都 带 有 工厂 校准 的 数字 温度 传 感 
器 。 数 字 温 度 传感器 电路 类 似 于 前 面 描述 的 至 强 处 理 器 和 酷睿 处 理 需 系列 ， 传 感 
器 电路 也 被 部 署 在 协 处 理 器 芯片 上 。PROCHOT# 和 THERMALTRIP# 信 号 以 相同 
的 方式 作用 于 系统 ， 触 发 降 频 或 关闭 。 降 频 的 第 一 阶段 是 在 预先 设 定 的 一 段 时 间 
内 ， 以 100MHz 为 单位 降低 频率 。 如 果 报 告 的 温度 然 没 有 降低 到 Tono AF, SR 
作 系 统 会 继续 降低 电压 。 多 核 芯 片 温度 传感器 读 值 的 滚动 平均 值 持 续 报 告 给 板 载 
管理 控制 芯片 ， 芯 片 同 时 也 通过 PC 总 线 接收 其 他 板 级 温度 传感器 以 及 电压 和 电 
流 监视 器 的 数据 。 通 过 系统 管理 总 线 (SMBus) 的 系统 软件 报告 热 状 态 ， 并 接收 
系统 指令 。 
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表 3.2 对 三 种 商用 处 理 器 [ 即 旧 人 处理 器 (Pentium M) 和 两 款 新 处 理 器 (XX 
特 尔 酷 害 17 和 AMD 的 Bulldozer) | 的 电压 和 频率 使 用 范围 进行 比较 。 处 理 需 内 
核 的 功率 和 频率 在 描述 范围 内 依据 各 自 的 机 制 进行 管理 。 


3.3 非 商 业 设 计 温 度 传 感 费 的 动态 优化 方法 


现 有 的 商用 芯片 DTM 温度 传 感 咒 反馈 回路 专注 于 跟踪 最 热 的 温度 ， 用 于 代 
表 必 片 整体 的 热 状 态 。 响 应 机 制 ( 如 性 能 降低 、 动 态 电 压 和 频率 缩放 ) 作用 于 核 
心 或 整个 芯片 范围 。 在 过 去 的 十 年 里 ，DTM 已 经 成 了 一 个 活跃 的 领域 ,关于 高 
性 能 系统 如 何 减 轻 热 控制 提出 了 各 种 方案 [3 。 新 兴 的 建议 主要 是 制定 各 种 微 结 
构 或 用 系统 水 平 的 观点 来 补充 粗 调 电 压 和 频率 缩放 。 下 面 将 讨论 这 些 学术 研 究 的 
突出 例子 。 


3.3.1 基于 硬件 设计 的 热管 理 


在 学 术 领 域 ， 涉 及 硬件 为 基础 的 降 频 DTM 提出 了 各 种 增强 的 动态 电压 和 频 
率 缩放 以 及 时 钟 节 流 的 方法 。 更 重要 的 是 ， 它 们 在 微 架 构 技术 相关 领域 做 出 了 突 
出 的 、 新 颖 的 贡献 。 后 者 引入 动态 管理 中 的 主要 结构 块 〈( 例 如， 缓存 、 读 取 、 
解码 、 规 格 检测 单元 ) 作为 温度 传感器 反馈 的 响应 。 学 术 人 研究 可 划分 为 以 下 两 
大 类 。 

1) 关于 传感器 温度 数据 进行 额外 后 处 理 的 提议 (如 过 滤 、 外 推 的 物理 温度 
传感器 数据 ) o 

2) 关于 创造 更 高 水 平 的 活动 指标 和 温度 之 间 的 相关 性 的 提议 ， 使 用 物理 温 
度 传感器 的 反馈 来 训练 出 代表 性 模型 。 

下 面 将 探讨 涉及 硬件 和 DTM 结构 功能 的 主要 成 果 ， 从 以 下 三 个 主要 观点 展 
开 讨论 。 
3.3.1.1 热管 理 涉 及 的 架构 功能 

早期 的 一 些 研 究 认为 需要 量化 传统 的 DTM 降 频 方案 与 性 能 影响 之 间 的 相关 
性 ， 据 此 提出 了 很 多 潜在 的 方法 :3”1。 基 于 既定 的 相关 性 ， 提 出 了 替代 管理 方 
法 。 除 了 现 有 的 电压 和 频率 缩放 (应 用 于 多 数 商 业 产品 ) 、 指 令 缓 存 节 流 (Pow- 
erPC) 、 频 率 缩放 (应 用 在 一 些 商 业 产 品 ) ， 还 提出 了 两 个 新 的 微 架 构 解 决 方案 。 
第 一 种 方法 是 当 温 度 传感器 反馈 超过 安全 限制 时 ， 限 制 投 机 窗口 的 执行 。 另 一 种 
方法 称 为 指令 缓存 切换 ， 禁 用 取 指 令 单 元 和 一 个 特定 的 周期 数 分 支 预测 单元 。 在 
运行 期 间 ， 从 指令 获取 队列 馈送 处 理 器 。 此 项 研究 ， 重 点 研究 了 DTM 机 制 的 响 
应 延迟 作用 及 其 在 热管 理 的 有 效 性 中 扮演 的 角色 。 图 3.9 对 比 进行 了 详细 描述 。 
图 中 描绘 了 两 个 热 响 应 曲线 ,分 别 为 有 DTM 和 没有 DTM 的 系统 (如果 封 装 和 冷 
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却 设计 得 当 ， 并 且 TDP 计算 准确 ) 。 当 系统 达到 热 设计 点 并 停留 在 此 ， 直 到 工作 
负载 的 活动 阶段 结束 ， 进 入 低 活 性 或 空闲 期 间 。 如 果 系 统 使 用 DTM， 传 感 器 将 
通知 DTM 靖 值 已 超过 ， 但 响应 将 延迟 激活 。 由 于 延迟 的 存在 ， 系 统 将 在 一 段 时 
间 内 超过 安全 限制 ， 这 与 系统 所 经 历 的 热 循 环 持续 时 间 有 关 。 在 此 基础 上 ， 人 们 
提出 了 一 种 解决 方案 ， 以 减少 调用 DTM 结构 管理 方案 的 概率 。 具 体 的 ， 有 人 提 
出 把 芯片 上 传感器 的 数据 直接 写 入 相应 的 部 件 工作 状态 机 器 内 。 

温度 
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图 3.9 DTM 反应 延迟 对 系统 热 状态 的 影响 


这 项 工作 重要 的 意义 在 于 它 第 一 个 尝试 系统 地 量化 影响 (性 能 降低 ) 和 收 
益 ( 热 紧急 状态 执行 周期 中 的 有 效 周期 )。 其 主要 发 现 为 管理 计划 的 热 效 益 是 与 
延迟 激活 紧密 耦合 。 在 这 方面 ， 电 压 和 频率 缩放 似乎 处 于 劣势 。 另 一 方面 ， 精 细 
结构 的 方法 提供 了 更 高 的 性 能 。 虽 然 结论 仍然 成 立 ， 但 是 电路 设计 的 稳 压 器 和 时 
钟 发 生 器 已 经 有 了 显著 的 进步 ， 它 有 助 于 降低 缩放 电压 和 频率 延迟 启动 的 负面 影 
响 。 一 项 相关 的 工作 具体 包括 电压 和 频率 缩放 到 最 优 值 时 不 可 忽略 的 过 渡 过 程 延 
迟 ， 其 中 还 包括 在 实际 过 渡 模型 中 ， 如 何在 离散 的 多 组 选择 中 找到 最 优 的 选 
择 4) 。 研 究 的 主要 结果 表明 ， 应 该 高 速 运行 的 微 处 理 器 ， 一 旦 温度 接近 最 大 人 允 
许 温度 ， 由 于 传感器 触发 热 限制 ， 在 整个 剩余 时 间 内 系统 只 是 在 高 电压 /频率 水 
平和 低 高 电压 /频率 水 平 之 间 波 动 。 

另 一 个 开创 性 的 工作 是 ,专注 于 联合 优化 能 源 效率 和 热 负载 !5] 。 从 广义 上 
讲 ， 这 项 研究 创建 了 一 个 包含 大 量 可 能 干预 方法 的 优先 级 列表 ， 它 们 可 以 被 单独 
或 成 组 应 用 。 根 据 热 紧 急 情况 的 严重 程度 ， 选 择 适当 的 方法 。 当 芯片 温度 传感器 
上 报 的 温度 上 升 到 或 低 于 一 定 的 限 值 后 ， 技 术 干 预 在 工作 列表 中 被 添加 到 或 删 
除 。 当 一 个 完整 的 工作 列表 都 被 激活 ， 而 且 所 有 可 能 的 方法 共同 作用 仍然 不 能 降 
低 峰 值 温度 时 ， 系 统 需要 一 个 安全 机 制 ， 如 商业 处 理 器 THERMALTRIP# 状 态 。 
此 项 研究 增加 了 一 些 新 的 技术 ， 以 评估 它们 的 算法 。 它 们 的 新 技术 主要 集中 在 研 
究 存 储 髓 层次 的 结构 动态 管理 ， 如 缓存 Subbanking 和 降低 DRAM 电压 。 
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空间 感知 性 能 调节 方法 提供 了 DTM 频率 选择 中 的 物理 感知 概念 56] 。 这 种 方 
法 为 帮助 确定 热 紧 急 状 态 下 频率 降低 的 水 平 提供 了 一 种 系统 的 方法 。 它 可 以 在 一 
个 给 定 的 时 间 内 使 某 个 核心 在 热 应 急 状态 下 ， 仍 然 保持 最 高 工作 频率 。 因 此 ， 降 
频 对 其 性 能 的 影响 将 比较 小 。 降 频 选 择 的 方法 展示 了 两 个 重要 的 能 力 。 首 先 , € 
考虑 了 系统 的 物理 特性 ， 即 在 热 应 急 状 态 下 物理 相 邻 的 核心 之 间 的 热 相互 作用 ; 
第 二 ， 它 提供 了 一 个 快速 的 方案 优化 技术 ， 以 将 核心 频率 降 频 的 负面 影响 降 到 
最 低 。 

另 一 种 空间 方法 引入 了 一 种 架构 工具 用 于 执行 性 能 降 频 ， 而 不 是 先 诉 诸 整个 
芯片 的 电压 和 频率 缩放 。 这 种 方法 被 称 为 偶然 - 2 周期 操作 571 。 它 侧重 于 热 事 
件 的 空间 影响 ， 重 新 设计 了 功能 单元 〈 加 法 器 和 乘法 器 ) ， 以 便 它们 可 以 有 选择 
性 地 提供 一 个 缩放 电压 ， 同 时 在 芯片 范围 内 仍 保持 相同 的 频率 。 大 多 数 的 热 峰 预 
计 发 生 在 这 些 单位 附近 。 热 点 也 可 以 出 现在 指令 提取 单元 和 寄存 器 文件 附近 ， 这 
是 一 个 合理 的 近似 假设 。 它 可 以 减轻 局 部 过 热 问题 ， 而 无 须 在 整个 世 片 范围 内 降 
频 。 当 工作 在 一 个 降低 后 的 电压 时 ， 关 断 关 键 路 径 的 松弛 会 使 单元 在 一 个 单一 的 
周期 内 产生 延迟 ， 当 然 偶尔 会 需要 两 个 周期 ( 如果 少数 关键 路 径 之 一 被 激活 ) 。 
这 些 单元 通过 温度 传 感 避 的 反馈 激活 控制 。 当 传 感 避 触发 超过 热 极限 时 ， 这 些 功 
能 单位 就 会 切换 到 一 个 低 电压 水 平 。 

最 后 ， 有 大 量 的 工作 专注 于 主动 的 热管 理 。 基 于 软件 的 功率 和 温度 的 估计 ， 
纯粹 依 徘 性 能 计数 絮 和 其 他 相关 的 系统 事件 进行 管理 。 由 于 我 们 关心 的 范围 集中 
在 温度 传感器 的 反馈 及 其 在 热管 理 的 电路 和 系统 中 作用 ， 所 以 应 该 了 解 这 一 领域 
的 研究 ， 但 不 会 详细 的 介绍 其 内 容 。 然 而 ， 有 一 些 方法 ， 结 合 了 离线 预测 / 预 优 
化 与 运行 时 片上 温度 传感器 的 反馈 。 一 个 例子 是 两 相 DTM 计划 '3]。 在 第 一 个 脱 
机 阶段 计算 每 个 处 理 器 核心 的 最 佳 频率 设置 ， 如 果 负 载 从 一 定 的 温度 开始 执行 ， 
达到 的 稳 态 温度 将 低 于 安全 净值 。 此 信息 被 存储 在 一 个 表 中 ， 该 表 记 录 了 一 些 频 
率 和 对 应 的 启动 温度 。 在 运行 期 间 的 第 二 阶段 ， 对 每 个 核心 上 的 温度 传感器 进行 
采样 ， 并 访问 离线 阶段 设立 的 表 查 找 最 佳 频率 ， 以 保持 核心 的 温度 在 下 一 个 时 间 
周期 前 保持 在 安全 温度 之 下 。 另 一 个 间接 的 限制 性 能 方法 也 是 很 有 趣 。 它 将 一 个 
单一 的 传感器 反馈 转换 为 功率 信息 ， 并 将 功率 信息 重新 映射 到 多 网 格 功率 分 布 的 
系统 软件 US. BERE, ， 功 率 分 布 图 将 会 被 用 于 散热 受 限 的 多 核 处 理 器 的 吞吐 量 
管理 。 

片上 热 积累 的 可 靠 性 问题 使 我 们 应 重新 审视 性 能 降 频 机 制 。 结 合 对 可 靠 性 问 
题 的 观察 发 现 ， 一 段 时 间 的 强 热 应 力 可 以 通过 另 一 段 时 间 低 热流 的 工作 状态 进行 
补偿 。 一 个 精心 调整 的 可 靠 性 模型 (主要 代表 温度 对 电子 迁移 的 影响 ) 在 管理 
循环 中 加 以 应 用 ， 采 用 芯片 电流 温度 状况 指导 动态 电压 和 频率 缩放 FO) 。 可 靠 性 
模型 有 助 于 定义 一 个 所 谓 的 寿命 银行 储蓄 ， 芯 片 停留 在 较 高 温度 状态 下 的 时 间 越 
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多 ,需要 低温 状态 下 补偿 工作 的 时 间 就 越 多 。 


有 趣 的 是 ， 为 提升 系统 的 性 能 而 故意 把 芯片 在 短 时 间 内 超出 它们 安全 温度 限 
制 的 技术 在 产品 中 也 有 了 应 用 。 新 一 代 处 理 融 中 的 涡轮 增 压 技术 也 可 能 导致 这 样 
的 热 响应 。 关 于 此 观点 的 一 个 例子 是 软 热 极限 的 概念 !51 。 在 特定 的 时 间 长 度 
内 ， 对 于 热 极限 给 予 一 定 程 度 的 灵活 性 ， 建 议 的 方法 提供 了 一 个 优化 问题 及 有 效 
的 解决 方案 ， 从 而 最 大 限度 地 提高 在 此 期 间 分 配 的 时 钟 频 率 。 我 们 注意 到 ， 这 种 
方法 与 之 前 提 到 如 寿命 银行 储蓄 等 的 可 靠 性 模型 相 比 ， 会 产生 更 有 趣 的 结果 。 

随 着 单个 核心 电压 调节 和 时 钟 生 成 功能 的 推出 ， 在 新 一 代 的 处 理 需 中 ， 业 界 
已 经 开始 考虑 利用 这 个 功能 建立 更 细 粒 度 控制 的 DTM。 关 于 这 方面 的 研究 ， 性 
能 降 频 仍 可 以 被 认为 是 一 个 多 尺度 和 分 布 式 的 问题 。 在 设计 的 粒度 方面 有 多 种 选 
择 ， 例 如 可 选择 单个 核心 或 多 个 核心 。 这 种 多 尺度 解 空间 量化 与 基于 传 感 带 的 进 
程 迁移 策略 的 耦合 问题 已 经 有 了 相应 的 研究 !'] 。 操 作 系统 主导 的 迁移 策略 是 一 
个 外 循环 ， 内 循环 是 一 个 控制 理论 的 动态 电压 和 频率 缩放 的 方案 〈 适 用 于 单个 
核心 或 所 有 核心 ) 。 内 部 和 外 部 循环 都 可 以 由 传感器 触发 。 另 一 项 研究 强调 也 
片 分 布 式 降 频 的 好 处 ， 研 究 提出 了 将 温度 传感器 的 读数 应 用 到 一 个 反馈 控制 器 ， 
在 保证 性 能 目标 的 同时 尽量 不 触发 降 频 '®]。 分 布 式 DTM 也 被 公认 为 是 特别 适合 
减轻 多 线程 并 行 架构 (SMT) 中 并 行 线程 不 公平 处 置 的 方法 。 在 SMT 中 ， 由 一 
个 密集 的 线程 引起 的 过 热 触 发 而 导致 其 他 线程 的 降 频 是 不 公平 的 ， 因 为 其 他 线程 
本 身 并 不 会 导致 过 热 。SMT 的 群集 配置 传感器 已 被 用 于 通过 各 自 温 度 传感器 反 
馈 来 确定 过 热 集群 [%1 。 如 果 集群 的 温度 读数 显示 其 温度 超过 限 值 ， 则 分 布 式 的 
降 频 技术 只 会 降低 对 应 特定 集群 的 调度 率 ， 而 其 他 集群 及 其 线程 仍 正常 运行 。 

男 一 个 技术 的 发 展 创造 了 DTM 的 新 途径 。 新 兴 的 3D IC 技术 人 带 来 了 新 的 
CMP 概念 ， 一 些 计算 核 心 和 一 个 大 容量 的 内 存 可 以 被 集成 为 一 个 紧密 耦合 的 系 
统 ， 其 内 部 有 巨大 的 数据 通信 人 带宽。 在 3D 世 片 中 ， 治 垂直 轴 方 向 堆 麦 的 几 个 高 
活性 层 具 有 较 低 的 导热 系数 ， 这 给 散热 带 来 了 额外 的 难度 ， 因 此 3D 芯片 的 热管 
理 引 起 了 很 多 的 关注 和 研究 。 早 期 研究 提出 了 支持 3D CMP 热管 理 的 操作 系统 和 
专门 的 硬件 '$] , DIM 系统 控制 性 能 的 全 局 降 频 以 及 局 部 的 分 配 工作 负载 。 

为 实现 上 述 管 理 方案 ， 人 们 开发 出 了 支持 温度 监控 人 硬件 的 新 电路 。 一 个 集成 
的 热 监测 硬件 系统 已 经 被 提出 ， 其 包括 由 几 个 负责 采集 传感器 数据 的 元 件 、 热 限 
制 的 可 编程 设置 、 可 编程 寄存 咒 传 感 器 输出 的 比较 、 热 急救 中 断 的 产生 以 及 风扇 
控制 1%] 。 这 项 工作 独特 之 处 是 考虑 以 硬件 为 基础 的 冷却 风扇 控制 机 制 ， 以 前 的 
实现 方法 是 将 温度 数据 上 报 给 操作 系统 ， 然 后 委派 风扇 控制 任务 到 软件 层 。 

对 于 特定 的 应 用 程序 ， 也 可 以 采用 特定 于 域 的 方法 。 一 个 例子 是 改良 的 解码 
序列 在 运动 图 像 专家 组 ( MPEG) 解码 中 的 应 用 [9 。 在 解码 帧 期 间 ， 应 用 程序 
密集 活动 。 将 这 段 时 间 和 预期 的 温度 上 升 时 间 对 比 ， 分 析 过 后 做 出 反应 。 解 码 活 
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动 的 时 间 被 分 为 许多 短 时 段 的 子 活动 ， 这 些 有 解码 活动 的 时 段 之 间 用 空 载 时 间 进 
行 分 隔 ， 这 种 解码 间隔 时 间 在 温度 可 能 上 升 到 触发 热 节 流水 平时 会 变 得 更 长 。 它 
将 不 可 避免 地 延长 解码 帧 的 总 花费 时 间 。 由 于 系统 受 限 于 完成 解码 的 最 后 期 限 ， 
一 些 帧 可 能 会 错过 它们 的 最 后 期 限 ， 这 些 帧 会 被 应 用 程序 丢失 掉 。 最 终 分 析 结 
表明 ， 这 些 方案 能 确保 芯片 处 于 安全 节 流 温度 的 范围 内 ， 并 尽 可 能 少 地 牺牲 输出 
质量 和 性 能 。 

基于 良好 设计 和 传感器 策略 性 布局 的 温度 直接 测量 结果 是 最 可 靠 的 表示 热 状 
态 的 参数 ， 不 同 芯片 之 间 传 感 器 读数 的 可 靠 性 可 能 会 表现 出 一 定 的 差异 。 最 终 会 
转化 为 温度 测量 的 不 确定 性 。 一 个 半 马 尔 可 夫 决 策 过 程 基础 上 的 随机 决策 机 制 已 
经 被 提出 ， 并 用 以 执行 节 流动 作 !%1 。 在 预定 义 的 决策 时 期 ， 热 管理 器 接收 温度 


传感器 的 反馈 。 传 感 器 读数 转换 到 概率 为 3 的 范围 内 ， 在 每 一 个 温度 范围 对 应 扫 


管理 器 的 一 个 状态 。 热 管理 器 可 以 选择 性 能 降 频 动作 (或 任何 额外 的 管理 行动 ) 
以 应 对 观察 到 的 状态 。 每 个 动作 都 有 可 能 使 热管 理 器 进入 不 同 的 状态 。 
3.3.1.2 用 片上 温度 传感器 的 后 处 理 数 据 进行 热管 理 

在 过 去 十 年 中 ， 芯 片 温度 传感器 的 覆盖 范围 有 所 改善 ， 得 益 于 面积 效率 和 高 
精确 度 的 传感器 设计 技术 的 进步 。 然 而 ， 基 于 当前 的 解决 方案 ， 想 得 到 一 个 非常 
细 粒 度 的 热 分 布 是 不 现实 的 。 人 们 已 经 提出 了 许多 关于 优化 配置 传感器 分 布 的 提 
议和 笠 代 定位 传感器 的 非 均匀 或 均匀 网 格 的 方法 。 第 2 章 中 讨论 过 这 些 方法 ， 本 
章 将 转向 我 们 关心 的 计算 技术 ， 旨 在 从 一 个 给 定 的 传感器 分 布 提高 最 终 的 测量 精 
度 。 在 大 多 数 实例 中 ， 要 求实 时 准确 地 测量 芯片 的 温度 ， 这 个 值 通常 用 来 触发 热 
管理 事件 。 从 粗 单 元 传感器 网 格 中 提取 最 详细 的 温度 分 布 ， 通 常 需要 一 个 热管 理 
机 制 的 支持 。 因 此 ， 在 很 大 程度 上 它 可 以 被 视 为 所 有 具有 温度 传感器 反馈 DTM 
技术 的 必 备 条 件 。 需 要 注意 的 一 点 是 ， 大 多 数 的 细 化 方法 依赖 于 涉及 浮 点 运算 复 
杂 的 优化 方法 。 鉴 于 潜在 的 高 硬件 成 本 ,没有 提议 设计 提供 一 个 专用 的 硬件 来 进 
行 必要 的 计算 。 因 此 ， 这 些 方法 需要 软件 实现 。 这 意味 着 它们 有 可 能 在 一 个 更 大 
的 时 间 尺 度 上 作为 一 个 软件 层面 DTM 的 指导 性 输入 。 由 于 在 时 间 尺 度 上 的 不 匹 
配 ， 细 化 方法 得 到 的 信息 不 可 能 用 于 驱动 基于 硬件 的 温度 监控 电路 ， 而 其 是 热 突 
发 事件 的 最 直接 和 最 重要 的 反应 手段 。 另 一 方面 ， 关 于 这 些 方法 的 实验 评估 表 
明 ， 这 些 方法 可 以 在 操作 系统 下 有 效 地 由 软件 执行 。 因 此 在 运行 时 ， 传 感 絮 数据 
的 细 化 方法 可 以 从 片上 温度 和 功率 传感器 (或 功率 估计 ) 上 采集 数据 ， 通 过 将 
一 组 有 限 的 传感器 的 数据 映射 到 一 个 更 广泛 的 温度 分 布 图 ， 软 件 层面 的 DTM 可 
以 利用 这 些 信息 来 进行 管理 方案 选择 。 总 体 而 言 ， 下 面 描述 的 方法 可 以 改进 软件 
层面 的 按 需 热管 理 。 

在 将 有 限 的 温度 传感器 数据 转化 为 精确 详细 温度 分 布 的 各 种 方法 中 ， 
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Kalman 滤波 方法 !@] 由 于 其 相对 于 其 他 更 复杂 的 非 线 性 估计 方法 更 为 简单 ， 反 而 
成 了 最 流行 的 方法 。 它 非常 适合 于 实时 应 用 ， 如 为 DTM 后 处 理 数据 。Kalman JE 
波 器 是 一 个 众所周知 的 工具 ， 用 于 处 理 有 很 多 噪声 观测 数据 的 建 模 。 在 观测 和 测 
量 的 数据 存在 不 确定 性 和 噪声 的 情况 下 ，Kalman 滤波 器 在 本 质 上 提供 了 一 个 很 
好 的 估计 方法 。 这 被 看 作 是 过 滤 噪 声 的 一 种 形式 ， 因 此 该 方法 被 称 为 过 滤 髓 。 它 
可 以 创建 一 个 模型 ， 通 过 评估 预测 值 和 下 一 个 观察 状态 之 间 的 差异 ， 不 断 更 新 底 
层 系 统 的 视图 。 不 同 的 涉及 计算 方法 的 建议 被 提出 [7 -5] 。 这 种 方法 的 早期 研究 
采用 两 步 法 [70] 。 第 一 步 是 离线 执行 ， 创 建 RC 等 效 热 网 络 系统 。RC 等 效 热 网 络 
被 表示 为 一 个 状态 空间 ， 每 个 节点 的 功率 作为 其 输入 。 状 态 空 间 模 型 一 般 用 一 阶 
ARE OD Tr TEASER n 阶 微分 方程 。 在 这 种 情况 下 ， 在 节点 处 的 温度 是 状态 空间 模 
型 的 输出 ， 其 中 一 些 节 点 的 温度 (假设 该 模型 的 网 格 将 比 物理 传 感 需 的 物理 分 
布 更 细 ) 等 于 从 温度 传感器 接收 到 的 观测 值 。 这 个 基本 模型 是 两 方程 的 形式 ， 
一 个 方程 代表 状态 矩阵、 输入 和 矩阵 和 状态 向 量 的 时 间 依 赖 关 系 ; 另 一 个 方程 代表 
状态 向 量 、 输 入 和 矩阵、 过渡 矩 阵 和 最 终 状 态 的 关系 [1 。 在 这 个 具体 的 问题 中 ， 
第 一 个 方程 的 形式 是 连续 时 间 一 阶 微分 方程 ， 即 
T= -(C-1G)TCD + CPG) (3.5) 
在 状态 空间 模型 中 的 各 项 中 ， 节 点 温度 向 量 T(1) 是 随时 间 变 化 的 状态 向 
量 ， 方 程 中 包括 热 容量 矩阵 的 道 C7! 和 热传导 和 矩阵 G， 它 们 是 状态 矩阵 ， 也 是 一 
个 常数 。P(t) 是 在 每 个 节点 随时 间 变 化 的 功 耗 向 量 ， 对 状态 空间 模型 的 输入 
矩阵。 
第 二 关系 式 将 输入 向 量 转换 为 一 个 状态 输出 ， 它 对 应 于 在 传 感 需 位 置 的 温度 
值 ， 即 


S(t) =FT(t) + DP(t) (3.6) 

式 中 , 了 是 常数 输出 矩阵; D 是 所 谓 的 直接 转移 矩阵 ， 也 是 常数 。 不 具备 输入 直 

接 影响 系统 输出 路 径 的 D 矩阵 可 以 被 假定 为 零 矩 阵 。 这 种 假设 已 被 用 于 这 种 特 

殊 的 情况 ， 它 消除 了 方程 右边 的 第 二 项 。 在 实际 应 用 中 ， 连 续 时 间 模 型 首先 离散 化 

为 时 间 变 量 ¢ 与 时 间 步 长 变量 n， 表 将 温度 对 时 间 的 导数 用 n +1 步 的 了 值 近似 表 

示 。 此 外 ， 新 增加 (o[n]) 表示 在 等 效 热 网 络 模 型 中 的 误差 , 增加 (o[n]) X 

示 传 感 器 测量 噪声 。 需 要 注意 的 是 ， 假 设 模型 中 的 不 精确 性 主要 表现 在 对 应 于 电导 

和 矩阵 的 直流 分 量 中 ， 而 电容 矩阵 表示 的 和 暂 态 分 量 可 以 忽略 。 现 在 ， 模 型 可 采取 式 
(3.7) 和 式 (3.8) 所 示 的 形式 表示 。 

T(n4+1)  -(C^!G)T(n) +CP(n) +Go[n] (3.7) 

S(n) =FT(n) + (3.8) 

Kalman 滤波 需要 两 个 额外 的 信息 进行 估计 。 测 量 噪声 协 方差 和 建 模 误 差 协 
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方差 也 需要 计算 出 来 。 应 用 这 两 个 已 知 的 协 方差 矩阵 和 离散 状态 空间 表示 Kal- 
man 滤波 的 目的 是 尽量 减少 协 方差 的 估计 误差 。 实 际 估计 分 两 个 阶段 进行 。 在 每 
一 个 时 间 步 长 n%， 由 nn-1 步 的 数据 估计 所 得 的 温度 值 更 新 为 传感器 从 第 nn 步 的 
观测 值 。 更 新 的 值 T(n) 进一步 被 用 来 估计 T(n +1)。 上 述 动作 构成 了 第 一 阶 
段 ， 称 为 时 间 更 新 阶段 。 第 二 阶段 称 为 测量 更 新 阶段 ， 新 的 传 感 需 测量 的 SCz +1) 
用 来 调整 T(n+1) 的 估计 值 。 

为 了 减少 这 种 方法 的 计算 复杂 度 ， 一 种 简化 的 方法 是 假设 传感器 噪声 和 建 模 
误差 协 方差 不 随时 间 改 变 。 因 此 ， 它 们 不 需要 在 运行 时 计算 。 这 会 降低 Kalman 
滤波 的 复杂 度 ， 从 三 次 多 项 式 转换 为 二 次 多 项 式 。 这 反 过 来 又 需要 一 次 校准 ， 以 
建立 一 个 稳 态 滤波 器 。 同 时 ， 对 等 效 热 网 络 的 电容 和 电导 矩阵 通过 模型 降 阶 进行 
简化 。 这 个 特定 的 方法 应 用 了 基于 投影 的 隐 式 时 间 匹 配 技术 [”6] 。 

一 个 提议 旨 在 通过 一 个 结合 了 Kalman 滤波 器 和 马尔 可 夫 决策 过 程 模型 151 温 
度 估计 的 中 间 层 ， 以 降低 温度 测量 的 不 确定 性 及 功率 消耗 的 随机 性 。Kalman JE 
波 器 和 之 前 摘 述 的 一 样 ， 通 过 嘲 杂 的 传 感 需 数据 反馈 进行 温度 估计 。 马 尔 可 夫 决 
策 过 程 使 用 概率 预测 系统 功 耗 。 结 合 从 两 种 组 件 收集 的 估计 值 ， 可 以 预测 在 芯片 
中 的 温度 分 布 。 

后 续 人 研究 进一步 推进 了 对 Kalman 滤波 器 应 用 的 知识 体系 以 及 对 片上 温度 传 
感 器 反馈 进行 精炼 的 其 他 统计 方法 I4.7”-501]。 主 要 增强 之 一 是 将 泄漏 的 功率 纳入 
到 温度 估计 。 在 热 监 测 的 情况 下 ， 有 人 认为 线性 Kalman 滤波 模型 会 低估 温度 ， 
因为 在 其 输入 抢 阵 的 状态 空间 模型 中 没有 考虑 泄漏 功 耗 。 由 于 泄漏 与 温度 的 非 线 
性 关系 ， 先 前 开发 的 线性 Kalman 滤波 估计 会 表现 不 佳 。 基 于 这 种 考虑 ， 用 于 表 
示 泄 漏 功率 影响 的 一 阶 泰勒 级 数 展开 已 经 更 新 为 扩展 版 的 Kalman JE C $8 fri 
ip), 最近， 人 们 提出 了 一 种 专门 针对 芯片 堆 共 技术 [目标 为 3D 多 处 理 器 系 
统 (MPSoC)] 的 传感器 反馈 细 化 方法 。 这 种 方法 的 目的 也 是 考虑 到 了 泄漏 的 影 
响 ， 它 使 用 的 是 无 迹 Kalman 滤波 方法 1 。 无 迹 Kalman 滤波 被 用 于 平面 二 维 芯 
片 的 线 温度 预测 ， 为 实现 类 似 的 目标 ， 需 要 准确 地 表示 汇 漏 功率 相关 的 非 线 性 行 
为 St。 这 种 方法 可 以 被 认为 是 更 准确 的 ， 因 为 无 迹 Kalman 滤波 经 历 了 非 线 性 变 
换 ， 可 以 处 理 概 率 行为 。 因 此 ， 非 线性 行为 是 完整 的 而 不 是 一 阶 近似 展开 。 构 建 
Kalman 滤波 器 的 设计 方法 如 图 3. 10 所 示 。 
3.3.1.3 为 DTM 建立 并 训练 用 于 协调 系统 事件 和 热 状态 的 模型 

随 着 半导体 工业 和 学 术 界 越 来 越 意识 到 热 监控 和 管理 的 重要 性 ， 一 个 并 行 的 
研究 分 支 专注 于 软件 层面 的 温度 预测 。 本 章 并 没有 详细 讨论 这 部 分 内 容 ， 因 为 它 
和 片上 温度 监控 并 没有 直接 的 关系 。 

尤其 在 早期 的 片上 温度 传 感 技 术 中 ， 只 依赖 传感器 的 直接 反馈 并 不 可 靠 。 这 
是 由 许多 因素 造成 的 ， 包 括 在 早期 产品 中 温度 传 感 需 部 署 数量 不 足 、 温 度 传感器 
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图 3. 10 ”用 于 后 处 理 温度 传感器 数据 的 各 种 类 型 的 Kalman 滤波 的 构建 方法 
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的 性 能 成 熟 度 的 制约 等 。 早 期 温度 传 感 需 的 不 足 体 现在 面积 、 功 率 效率 和 面 对 过 
程 、 电 压 和 热 波 动 时 的 稳定 性 。 在 过 去 的 十 年 中 ， 温 度 传 感 器 的 设计 技术 已 经 非 
常 先 进 。 制 造 商 开始 能 入 更 多 的 传感器 ， 且 它们 都 经 过 了 更 好 的 校准 和 更 准确 的 
位 置 分 布 。 为 在 短 时 间 内 立即 响应 热 事 件 ， 世 片 传感器 目前 基于 硬件 的 机 制 不 可 
或 缺 。 这 推动 了 一 系列 的 研究 ， 其 目的 是 结合 片上 传感器 和 应 用 程序 的 指标 来 设 
计 和 训练 预测 模型 ， 它 可 应 用 于 主动 的 模式 。 接 下 来 将 回顾 这 些 研 究 ， 因 为 它们 
与 聚焦 点 更 加 密切 相关 。 需 要 强调 的 是 ， 片 上 传感器 数据 和 训练 预测 模型 以 及 传 
感 器 输入 后 处 理 的 方法 有 明显 的 不 同 。 后 者 往往 结合 应 用 程序 级 别 和 架构 特征 ， 
作为 评价 功 耗 和 热 事件 的 一 个 指标 。 在 它们 的 模型 中 ， 有 可 能 包括 或 者 不 包括 功 
率 测量 功能 。 上 述 方法 中 的 高 级 特征 包括 硬件 性 能 计数 器 、 内 核 计数 器 、 结 构 计 
数 时 钟 频率 等 。 

早期 使 用 传感器 输入 训练 温度 预测 模型 是 一 种 基于 回归 的 热 模型 ,已 被 加 入 
到 操作 系统 的 内 核 中 !821 。 模 型 使 用 输入 性 能 计数 器 的 读 值 来 预测 系统 在 运行 时 
的 热 状 态 。 然 而 ， 它 只 文 持 由 芯片 上 的 温度 传感器 数据 进行 模型 的 训练 。 另 一 种 
基于 回归 的 方法 是 只 利用 温度 传感器 数据 的 自 回归 移动 平均 模型 CARMA) 082, 
以 前 ， 观 察 到 的 传 感 需 读数 被 用 来 预测 未 来 的 一 些 步 又 。ARMA 是 根据 给 定 负载 
的 代表 性 温度 变化 轨迹 得 到 的 。 在 系统 运行 时 ， 有 特定 的 一 个 功能 可 以 收集 新 温 
度 变化 轨迹 ， 如 果 新 变化 轨迹 和 模型 的 预测 有 较 大 的 偏差 ， 就 用 新 的 数据 来 修正 
模型 。 弟 推 最 小 二 乘法 (RLSM) 也 被 用 来 进行 预测 ， 利 用 最 近 的 温度 传 感 需 读 
数 可 估计 未 来 时 间 步 的 温度 [5 。 

性 能 计数 器 常 被 用 在 直接 功率 测量 的 地 方 ， 因 为 它 是 通过 处 理 器 的 活动 进行 
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修正 ， 所 以 可 提供 高 质量 的 数据 。 反 过 来 处 理 器 的 活动 和 功 耗 在 很 大 程度 上 是 线 
性 相关 的 。 例 如 ， 状 态 空间 模型 已 经 被 提出 ， 它 是 一 个 类 似 于 前 面 讨论 的 Kal- 
man 滤波 器 的 模型 ， 用 性 能 计数 器 信息 和 温度 传感器 的 反馈 来 训练 工作 负载 和 热 
事件 的 相关 性 。 这 方面 的 信息 被 用 来 构建 输入 和 矩阵 的 状态 空间 模型 ， 而 不 是 直接 
用 功率 的 数据 S51] 。 接 下 来 ， 模 型 可 以 根据 频率 来 预测 温度 。 基 于 此 实现 在 给 定 
的 限制 下 达到 最 优 的 控制 ， 使 芯片 温度 保持 在 允许 范围 内 的 最 大 值 成 为 可 能 。 
机 需 学 习 方法 已 经 成 为 研究 温度 预测 方法 的 一 种 自然 而 然 的 选择 。 基 于 支持 
向 量 机 (SVM) 的 模型 由 热 相关 的 系统 参数 进行 训练 ， 这 些 参数 包括 某 个 核心 
的 温度 、 周 边 相 邻 的 其 他 核心 的 温度 以 及 固定 时 间 内 分 配给 每 个 核心 的 任务 的 平 
均 功 率 分 布 [%] 。 每 一 个 这 样 的 特征 向 量 被 标记 为 过 热 或 没有 过 热 ， 这 取决 于 是 
否 由 相应 的 向 量 行为 导致 超过 系统 定义 的 热 安全 限 值 。 这 些 标签 和 特征 一 起 用 来 
训练 SVM。 机 器 学 习 方 法 的 男 一 个 突出 的 算法 是 强化 学 习 ， 它 运行 在 一 个 问 更 
高 回报 方向 自我 精炼 的 决策 机 制 下 ， 根 据 环境 对 当前 决定 的 反应 进行 模型 的 改 
进 。 在 热 监测 的 场景 中 ， 由 系统 工作 导致 的 温度 传感器 读数 的 变化 即 是 对 环境 的 
反应 ， 例 如 在 多 核 芯 片 中 的 任务 分 配 避 1] 。 强 化 学 习 通 过 温度 传感器 的 读数 和 时 
钟 频 率 的 设置 训练 出 的 模型 也 被 用 于 动态 电压 缩放 和 线程 分 配 ! 邢 ] 。 

最 近 的 一 项 研究 探讨 了 更 深 的 大 量 学 习 方 法 来 创建 一 个 在 线 温度 预测 的 适用 
性 ， 也 就 是 采用 温度 传感器 读数 作为 训练 阶段 的 一 部 分 [S33 。 对 于 一 个 给 定 的 系 
5, TE t 时刻 从 各 个 来 源 收 集 大 量 的 特征 ， 包 括 硬件 性 能 计数 器 、 温 度 传感器 、 
计数 句 和 和 内核。 其 中 有 些 特 征 与 应 用 特性 高 度 相 关 。 应 用 程序 在 不 同 的 处 理 器 或 
系统 中 运行 时 ， 这 些 特征 改变 不 明显 。 时 间 相 关 的 特征 被 标记 为 向 量 A(t)。 其 
余 的 特征 都 和 节点 的 物理 条 件 相 关 。 即 使 运行 在 相同 的 运用 条 件 下 ， 不 同 节 点 的 
特征 也 会 有 显著 的 差别 ， 这 取决 于 冷却 条 件 、 位 置 等 。 例 如 ， 温 度 传感器 的 读数 
就 是 这 个 类 别 。 这 种 特征 被 称 为 物理 特征 ， 表 示 为 矢量 P(1)。 最 终 的 目标 是 获 
得 一 个 模型 ， 预 测 下 一 时 间 节 点 i 的 温度 ， 那 么 有 

T(i) =f/(A(i) ,A(i-1),P(i-1)) (3.9) 

神经 网 络 、 贝 叶 斯 网 络 、 线 性 回归 模型 、 多 层 感 知 器 、 代 表 树 和 高 斯 方法 等 
机 器 学 习 方 法 都 进行 了 评估 。 而 高 斯 方法 被 确定 为 最 成 功 的 学 习 方 法 。 

高 斯 过 程 是 一 组 随机 变量 (XQ, X,, +) 的 随机 过 程 , 这 些 变量 的 任何 子 
集 都 构成 高 斯 分 布 。 它 假定 所 有 物理 属性 的 任何 子 集 向 量 (PCR), PCS), ，…， 
P(ij), P(ij,,),) 构成 高 斯 分 布 。 

(PCi), PCi), PCa) Pina), - NC(O,K)) (3. 10) 

式 中 , Ke RUD CD RRgIJT2ERBIE, PEPE O 作为 高 斯 分 布 的 均值 是 一 种 常见 
的 做 法 。 这 个 和 珑 阵 的 元 素 是 由 一 个 核 函 数 K 计算 得 来 的 : 

KU) -k(X(i) ,X(4)) (3.11) 
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X(i;) =(A(i;) AG; -1),P(i; -1)), 
TF PRE AREAS XG) MX) 之 间 的 相关 性 ， 生 成 协 方差 矩阵 。 由 
一 组 观测 值 (PC), PC), ，…， 已 (三 ) ) 8I (XC), XC) , ++, XCGS,)) 通 
过 模型 生成 (i, ) 的 预测 值 : 
E (P(Gi,,1X,P,X,,,) -K(X,.,, X) K (X,X) IP, (3.12) 
SUP. P=(P(i), PU) =, P(i,)), 
X - (X(5), XC), +, XC) ) 
因此 ， 温 度 预测 模型 /可 以 表述 为 如 下 形式 : 
f=E(P(i 1) UEX,P,CA C, 4) AC 71) Psi))) (3. 13) 


3.4 基于 温 


由 于 热效应 在 系统 范围 都 有 突出 的 影响 ， 温 度 传 感 顺 现在 也 集成 到 处 理 需 必 
片 以 外 的 组 件 上 。 近 几 代 DRAM 芯片 已 经 配备 了 温度 传 感 医 ， 也 有 一 些 硬盘 驱 
动 器 和 固态 硬盘 驱动 器 配备 了 温度 传 感 需 。 


3.4.1 基于 温度 传感器 的 DRAM 刷新 率 及 写 时 序 优化 


工作 温度 和 DRAM 具有 特殊 的 相关 性 。 由 于 DRAM 的 泄漏 和 温度 是 超 线性 
关系 ， 所 以 内 存单 元 丢失 内 容 的 风险 很 高 。 当 电荷 存储 在 一 个 单元 内 ， 这 时 相应 
的 输出 电压 下 降低 于 一 个 限制 值 Voi", DRAM 的 感 测 放大 器 不 再 检测 ， 所 存储 的 
内 容 就 会 丢失 。DRAM 单元 电压 Vua 下降 到 所 花费 的 时 间 ， 被 定义 为 一 个 
DRAM 单元 的 停留 时 间 。 它 可 以 表示 为 电压 每 下 降 一 个 台阶 所 花 时 间 的 总 和 ， 即 
AQ cen = Cip X AV (3. 14) 
内 存单 元 中 存储 的 电荷 在 电压 Vii? RI Jp 之 间 转 换 。 总 的 停留 时 间 可 以 表 
示 为 


Vo» Ceen dV een 
了 = ce. ce (3. 15) 
" é Teak 
WF, Cer DRAM 的 有 效 电 容 。 上 式 可 以 近似 为 
三 Coen ( Vpp = AVE (3 16) 


ret 


Deak 

在 最 坏 情 况 下 ， 内 存单 元 电压 降 A 多 车 变 为 内 存 电容 Co 、 位 线 电容 CR 
Var ayer zc, Bil 
Vpp Ceen + Cpr 


AVi = Ge VEL Hn 
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将 Avesta Ask (3.16) 得 : 


V, Coe +C min 
Cea Vpp T a 5j C n a VBL ) (3 18 ) 
T - ce j 


ret 


Teak 
X3. 3 表明 了 应 用 于 移动 市 场 的 老 一 代 内 存 刷 新 电流 和 温度 的 关系 ， 以 及 和 
最 新 DDR3 内 存 之 间 的 差异 O87) 
表 3.3 内存 的 刷新 电流 与 温度 有 很 强 的 相关 性 (刷新 电流 随 着 温度 的 升 
高 而 增长 ， 表 现 为 漏电 流 的 增加 。 随 着 容量 的 增加 ， 刷 新 功率 也 会 增加 ) 


45°C 时 的 刷新 电流 85*C 时 的 刷新 电流 
低 功 耗 移动 内 存 
64MB 100pA 200A 
128MB 150A sua 
256MB 180A dou 
DDR3L - SDRAM 
as 180A 225A 


上 述 的 保留 时 间 不 能 超过 一 个 给 定单 元 的 连续 刷新 操作 的 时 间 间 隔 ， 从 而 据 
此 算得 刷新 率 。 我 们 要 注意 保留 时 间 与 温度 密切 相关 ， 但 是 即使 在 相同 环境 温度 
下 ,还 有 其 他 的 因素 会 造成 DRAM 中 不 同 单元 之 间 的 差异 。 到 邻近 单元 访问 模 
式 引 起 的 过 程 变化 、 数 据 布局 和 耦合 可 能 会 导致 在 一 个 大 容量 内 存 :”] 单 元 保留 
行为 的 广泛 传播 。 另 一 方面 ， 内 存 刷新 率 不 能 为 保证 最 坏 的 情况 而 设置 为 任意 高 
频率 ， 因 为 这 将 会 显著 地 增加 刷新 功 耗 。 此 外 ， 刷 新 速率 影响 感知 访问 延 退 ， 因 
为 在 大 多 数 实际 应 用 中 ， 存 储 器 设备 在 刷新 期 间 停 止 对 来 自 核心 的 数据 请 求 的 服 
Fo DRAM 制造 商 确定 的 保留 时 间 ， 需 要 保证 足够 多 比例 的 单元 ， 在 最 坏 情况 下 
可 以 在 指定 的 工作 温度 范围 工作 ， 以 满足 一 定 的 良品 率 。 

DRAM 制造 商 已 经 把 新 功能 集成 到 了 他 们 的 许多 代 产 品 中 ， 为 了 减轻 这 个 问 
题 早期 的 产品 采用 专用 温度 传感器 放置 在 内 存 中 ， 其 温度 读数 由 系统 通过 串 行 存 
在 检测 (SPD) 进行 访问 。 配 备 SPD 功能 的 存储 器 模块 基本 上 都 包含 EEPROM, 
其 中 存 有 规格 和 操作 条 件 相关 的 各 种 信息 。 此 信息 从 一 个 单一 的 EEPROM 引 脚 
串 行 发 送 ， 然 后 将 通过 PC 总 线 或 各 种 SM 总 线 接口 进行 传递 。 

温度 传感器 芯片 可 以 放置 在 DRAM 芯片 中 [99 或 DIMM 板 附 近 ， 间 接地 追 
踪 DRAM 芯片 的 温度 。 温 升 的 检测 可 用 于 各 种 热管 理 行动 ， 以 减轻 数据 的 完 
整 性 和 内 存 模块 的 可 靠 性 问题 。 许 多 DRAM 芯片 使 用 的 传感器 读数 定义 了 两 
个 操作 区 间 : 中 正常 工作 的 温度 范围 (0 ~ 85%C ) ; 四 扩展 的 温度 范围 (85 ~ 
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9590) 5] 。 前 一 代 DRAM 在 商业 应 用 领域 达到 95% 。 军 事 和 空间 应 用 以 及 其 他 
特殊 区 域 可 以 使 用 更 高 温度 限 值 的 内 存 芯 片 。 

一 种 最 常见 的 方法 为 自动 温度 补偿 自 刷新 或 自 适应 刷新 :%*-%”] 。 根 据 从 内 置 
温度 传感器 接收 的 反馈 ， 调 整 存储 器 芯片 的 刷新 速率 以 适应 热 致 泄露 的 增加 。 双 
数据 速率 (DDR) 标准 规定 了 同一 位 置 的 商用 DRAM 芯片 两 个 连续 的 刷新 操作 
之 间 最 多 分 为 64ms。 通 常 细 分 为 几 个 较 小 的 刷新 操作 。 例 如 ， 在 64ms N, WR 
每 个 分 区 刷新 需要 7.8hs， 则 有 8192 个 分 区 的 内 存 可 以 被 刷新 。 刷 新 周期 是 针 
对 正常 操作 的 范围 。 当 内 存 温度 上 升 到 85% 时 ， 标 准 要 求 减 半 到 32ms (3.9ps 
每 分 区 ) 。 在 新 兴 的 3D HE DR AM 技术 中 ， 热 效应 的 影响 变 得 更 加 显著 。 最 近 
的 一 个 存储 器 模块 设计 采用 3D 堆 秋 芯片 ， 其 引入 了 第 三 刷新 周期 (HI Sms), 
以 应 对 温度 处 于 95 ~115% 范围 的 情况 [9%] 。 

另 一 个 对 温度 有 依赖 的 时 序 参 数 是 写 恢 复 时 间 ， 其 定义 为 数据 写 人 DRAM 
单元 需要 的 时 间 。 写 人 恢复 时 间 与 温度 呈 反 比例 的 关系 。 可 靠 的 操作 所 需 的 时 间 
随 着 工作 温度 的 增加 而 降低 10) 。 因 此 ， 片 上 温度 传感器 用 于 监测 DRAM 温度 
的 提议 也 已 经 被 提 及 。 写 和 人 恢复 时 间 周 期 的 长 度 可 以 用 上 次 写 和 之 后 的 预 充电 信 
号 的 特定 时 间 来 进行 调制 。 如 果 DRAM 温度 降 至 低 于 预先 定义 的 阔 值 ， 可 以 通 
过 延长 它 来 调整 写 人 恢复 期 间 。 由 于 定时 参数 直接 影响 DRAM 的 总 延迟 ， 所 以 
不 能 将 其 设置 为 任意 大 值 。 因 此 ， 利 用 动态 监测 片上 传感器 进行 调节 至 关 重 要 。 
这 样 才 可 以 保证 当 温度 已 超过 阔 值 时 ， 温 度 可 以 以 更 快 的 速度 下 降 到 一 个 较 低 
的 值 。 


3.4.2 基于 温度 传感器 的 DRAM 架构 优化 


上 述 两 种 动态 热 监测 的 应 用 和 DRAM 的 性 能 和 功 耗 直接 相关 。 此 外 ， 高 温 
也 会 造成 可 靠 性 方面 的 问题 。 

为 了 降低 工作 温度 ， 类 似 于 处 理 器 芯片 ，DRAM 的 性 能 也 可 以 进行 降 频 。 常 
见 的 方法 是 对 连接 内 核 和 DRAM 总 线 的 带宽 进行 节 流 或 是 自动 阻碍 计算 核心 活 
动 以 减少 其 访问 强度 U01102 。 通 过 调整 内 存 请 求 到 达 率 ，DRAM 的 活性 也 可 以 
被 调节 。 另 外 ， 从 存储 子 系统 中 得 到 的 温度 传感器 反馈 可 以 用 来 控制 冷却 系统 
(如 风扇 的 转速 )， 与 处 理 器 芯片 的 应 用 类 似 。 
3.4.3 基于 温度 传感器 的 硬盘 热管 理 

从 可 靠 性 的 角度 来 看 ， 热 效应 对 于 硬盘 很 重要 。 由 于 磁盘 堆栈 和 执行 器 在 高 
热 负载 下 扩展 ， 高 的 工作 温度 会 导致 磁道 错误 ， 从 而 影响 磁盘 的 性 能 ， 甚 至 造成 
致命 的 错误 。 在 消费 产品 市 场 上 ， 新 一 代 的 磁盘 驱动 器 已 经 开始 利用 峙 入 式 温 度 
传感器 。 系 统 软件 可 以 通过 设备 接口 访问 传感器 测量 值 。 有 的 产品 将 温度 传感器 
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反馈 传 给 冷却 风扇 ， 用 于 处 理 硬 盘 温 度 的 实时 变化 。 

在 人 硬盘 的 产品 路 线 图 中 ， 从 热 的 角度 进行 的 一 个 详细 分 析 认 为 ， 即 使 硬盘 的 
温度 不 会 随 着 硬盘 速率 和 容量 成 比例 增加 ， 其 速率 和 容量 的 增加 速度 也 不 可 持 
续 。 对 硬盘 的 性 能 和 密度 参数 的 研究 预测 表明 ， 只 要 不 超过 最 差 情况 的 温度 限 
值 ， 硬 盘 热 状态 都 会 非常 接近 1W] 。 然 而 ， 厂 商 只 能 满足 基于 温度 均匀 分 布 假设 
下 的 设计 目标 。 它 有 力 地 表明 像 本 章 中 讨论 的 其 他 系统 组 件 一 样 ， 为 保证 硬盘 驱 
动 器 在 满足 性 能 的 条 件 下 同时 满足 额定 温度 要 求 ，DTM 是 一 个 不 可 缺少 的 工具 。 
当 温 度 超 过 阔 值 时 ， 一 个 可 能 的 性 能 节 流 方法 是 动态 地 调整 发 送 到 磁盘 请 求 量 的 
一 个 冷却 时 间 ， 直 到 温度 传感器 信号 显示 硬盘 处 于 安全 温度 范围 内 ， 然 后 再 重新 
提高 硬盘 的 性 能 。 

接 下 来 是 关于 磁盘 驱动 器 热管 理 特 定 方法 的 研究 PM] 。 鉴 于 热效应 对 其 微 
结构 的 影响 ， 可 以 利用 这 一 特点 实施 降 频 。 在 一 项 研究 工作 中 ， 寻 找 操作 的 时 间 
间隔 被 发 现 有 机 会 用 来 实现 降 频 。 在 另 一 项 研究 中 ， 则 提出 由 多 速率 磁盘 驱动 器 
来 减轻 硬盘 过 热 ON 。 通 过 动态 调节 盘 片 的 旋转 速度 ， 实 现 了 类 似 于 处 理 器 中 
降 频 的 热管 理 效果 。 


3.5 热管 理 的 控制 系统 深入 探究 


在 当今 几乎 所 有 的 高 性 能 系统 组 件 中 ， 髋 入 式 温度 传 感 带 在 DTM 中 起 着 至 
关 重 要 的 作用 。 其 范围 覆盖 了 从 处 理 带 内 核 到 磁盘 驱动 器 ， 从 网 络 交 换 芯片 到 协 
处 理 器 和 加 速 器 等 。 在 控制 回路 的 另 一 端 ， 电 路 设计 技术 的 进步 使 得 DTM 可 以 
高 度 可 靠 和 日 趋 精 细 的 调节 电压 、 频 率 和 通信 带宽 等 参数 。 特 别 是 在 复杂 的 实时 
控制 方法 中 ， 这 两 个 代理 还 连接 到 另 一 个 关键 组 成 部 分 〈 即 控制 单元 ) ARTS 
结 了 DTM 的 热 传 感 器 反馈 的 作用 和 各 种 用 途 ， 并 提供 有 用 的 见解 ， 以 审查 选择 
一 套 突出 的 控制 系统 广泛 应 用 于 动态 管理 。 在 未 来 的 系统 中 ， 这 三 个 主要 代理 的 
合作 设计 和 合作 优化 可 能 引起 进一步 的 关注 。 在 下 面 介绍 中 ， 将 讲述 四 种 DTM 
中 用 到 的 主要 类 型 控制 机 制 ， 侧 重 于 讲述 每 种 机 制 机 理 方 面 的 背景 。 


3.5.1 闭环 控制 器 


闭环 控制 右 利 用 被 控制 系统 状态 的 反馈 进行 调节 。 在 热管 理 中 ， 它 对 应 于 温 
度 传感器 信息 的 采集 。 控 制 行为 通常 以 一 个 国定 的 频率 进行 。 例 如 ， 温 度 传感器 
通过 热 监控 电路 以 固定 的 采样 速度 收集 温度 信息 ， 并 传送 给 控制 系统 。 既 包括 完 
整 的 一 组 数据 ， 也 包括 已 经 过 处 理 得 到 的 最 大 温度 值 数据 。 闭 环 控 制 系统 主要 包 
括 以 下 四 个 主要 元 件 : Ove a; DER OZER 由 参考 设 定 。 图 
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3.11 显示 了 在 反馈 回路 中 基本 吉 件 的 运行 过 程 。 


控制 器 的 参考 设 定 可 以 是 触发 系统 降 频 的 温度 冰 值 。 控 制 器 的 温差 估计 模块 
计算 当前 温度 值 和 参考 设 定 值 之 间 的 温差 。 控 制 的 机 理 是 通过 向 执行 器 输出 一 个 
合适 的 反馈 w“， 尽 可 能 减 小 被 控 噩 件 当 前 温度 值 和 参考 设 定 值 之 间 的 差距 
ezR -S。 被 控 器 件 会 根据 新 的 输入 生成 一 个 新 的 输出 y， 输 出 值 经 温度 传 感 
器 采集 ， 并 且 将 其 值 重 新 带 入 回路 。 
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图 3.11 闭环 控制 系统 的 典型 反馈 回路 


3.5.1.1 比例 积分 、 微 分 控制 器 
控制 机 制 的 传递 函数 可 以 根据 它们 对 偏差 项 e 的 处 理 进行 分 类 。 最 简单 的 情 
况 是 一 个 比例 控制 器 ， 它 产生 一 个 与 e 成 正比 的 响应 ， 其 比例 系数 为 一 个 常数 。 
这 种 方法 往往 很 难 确定 一 个 常数 系数 以 有 效 实现 控制 机 制 ， 达 到 无 过 冲 / 响 应 不 
足 或 来 回 振荡 。 这 一 基本 方案 可 以 通过 添加 误差 的 积分 项 来 加 强 。 通 过 积分 将 误 
差 的 一 个 低 强 度 的 响应 长 时 间作 用 于 系统 , 这 有 助 于 控制 达到 收敛 。 由 此 产生 的 
控制 器 输出 函数 可 以 表示 为 
u(t) = Kie(D) + K Jer) deti elt) = y(t) -R (3.19) 


控制 絮 的 输出 函数 通常 用 拉 普 拉 斯 变换 形式 在 频 域 表示 如 式 (3.20) 所 示 ， 
其 中 控制 系统 的 时 间 依 赖 函数 e(i , u(t) 和 y(t) 被 转换 成 复数 变量 的 函数 。 


U(s) -K, ic (3.20) 
由 此 产生 的 控制 器 是 比例 积分 (PI) 控制 器 。 该 模型 的 男 一 个 扩展 是 再 加 入 一 
个 微分 项 ， 微 分 项 可 以 让 控制 变 得 平滑 ， 可 以 有 效 地 减少 控制 右 过 冲 或 响应 不 
足 。 由 此 产生 的 系统 被 称 为 比例 积分 微分 (PID) fima, HB 


集成 电路 热管 理 ; 片上 和 系统 级 的 监测 及 冷却 


u(t) = Kye(1) + Kyfos)de + Kp C M UC) =K, I + Kos (3.21) 


对 于 DTM 闭环 控制 系统 模型 被 用 来 控制 时 钟 的 占 空 比 %] 和 选择 (HUE. 
频率 ) 设置 !2,9] 。 如 果 DTS 输出 被 馈送 到 控制 系统 ， 那 么 积分 还 需要 以 离散 形 
式 近 似 。 在 这 种 情况 下， 积分 可 以 计算 每 个 采样 间隔 的 长 度 乘 以 此 间隔 内 偏差 e 
的 总 和 。 过 去 时 间 的 偏差 值 的 历史 纪录 需要 由 控制 絮 进 行 存储 。 可 以 通过 常用 的 
热 监 测 和 管理 的 专用 微 控 制 器 执行 。 如 果 控 制 器 接收 到 模拟 温度 传感器 输出 的 电 
压 或 电流 信号 ， 则 运算 放大 器 电路 可 以 被 用 来 计算 积分 。 确 定常 数 系数 值 是 另 一 
个 重要 问题 。 通 过 设置 这 三 个 主要 系数 (P, 1, D) 的 一 个 子 集 ， 控 制 器 可 以 被 
配置 成 仅 与 误差 信和 号 成 比例 的 控制 器 ， 也 可 以 配置 成 比例 微分 控制 器 ， 或 比例 积 
分 控制 器 (在 离散 样本 上 误差 信号 的 总 和 ) 。 在 三 种 控制 方法 可 同时 实施 的 一 个 
例子 中 ， 微 分 项 被 忽略 ， 由 于 基于 经 验 观 察 [2] 它 的 作用 不 明显 ， 或 由 于 它 对 噪 
声 的 敏感 性 !91] 。 

由 于 PID 控制 器 受 许 多 设置 影响 ， 所 以 具有 非 理 想 性 。 当 然 ， 事 实 上 ， 固 定 
增益 参数 带 来 了 一 些 局 限 性 ， 这 些 增益 参数 的 调整 最 终 会 影响 控制 器 的 表现 。 受 
探 器 件 以 及 传感器 在 响应 的 过 程 中 实际 上 也 引入 了 增益 因子 。 如 果 这 些 不 能 被 描 
述 或 最 小 化 到 可 以 忽略 的 程度 ， 控 制 器 的 有 效 性 会 受到 限制 。 

另 一 方面 需要 特别 关注 的 是 ，PID 控制 器 的 积分 饱和 现象 。 误 差 项 的 积分 分 
量 随 着 时 间 的 推移 可 以 积累 到 一 个 很 大 的 值 ， 即 使 每 个 时 间 步 长 的 单个 误差 值 很 
小 。 控 制 器 也 将 驱动 执行 器 达到 上 限 (例如 更 高 的 电压 、 频 率 ) 。 在 这 样 设置 的 
情况 下 ， 会 导致 执行 器 饱和 。 如 果 有 一 个 长 时 期 采样 反馈 为 正 误差 项 ， 随 后 另 一 
个 温度 传感器 显示 元 器 件 处 于 过 热 状 态 ， 误 差 项 的 符号 产生 变化 ， 此 时 控制 器 无 
法 很 快 地 适应 。 它 需要 一 段 时 间 才 能 “降低 积分 项 ” 。 这 可 能 会 导致 过 热 状 态 加 
剧 ， 因 为 控制 器 不 会 开启 降 频 。 相 反 的 情况 也 会 发 生 ， 在 很 长 的 高 活性 和 峰值 温 
度 期 间 ， 控 制 器 将 通过 执行 器 迅速 地 将 性 能 下 降 到 最 大 的 降 频 水 平 。 然 而 ， 由 于 
控制 装置 的 物理 性 质 ( 热 容 ) ， 降 低 性 能 带 来 的 温度 变化 不 会 瞬间 发 生 。 它 受到 
硬件 的 固有 时 间 常 数 的 限制 。 期 间 它 可 能 比 温度 传感器 采样 周期 较 长 ， 积 分 项 会 
再 次 大 量 地 隐藏 错误 。 当 设备 最 后 冷却 下 来 ， 积 累 的 积分 项 不 会 瞬时 减少 ， 这 会 
造成 系统 在 一 个 较 低 的 性 能 点 ， 这 非常 没有 必要 。 积 分 饱和 可 以 通过 控制 右上 的 
修改 来 减轻 。 一 种 选择 是 监视 执行 器 饱和 事件 ， 检 测 到 饱和 度 后 禁用 积分 项 。 由 
数字 传感器 输出 实现 离散 积分 的 情况 ， 可 以 限制 离散 的 步 数 ， 在 积分 过 程 中 限制 
饱和 程度 。 

最 后 ， 微 分 项 对 反馈 测量 噪声 敏感 。 它 可 以 预先 用 低 通 滤波 器 滤 除 高 频 分 量 
中 的 噪声 。 

也 有 些 闭 环 控 制 理论 之 外 的 因素 影响 着 动态 热 控制 机 制 。 执 行 器 的 延迟 
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由 控制 器 实施 新 设置 时 的 延迟 (电压 、 频 率 )， 超 出 了 控制 器 本 身 的 范围 。 同 
样 ， 所 涉及 材料 的 物理 性 质 也 决定 了 在 性 能 降 频 时 只 能 以 一 定 的 时 间 常 数 进行 降 
温 。 除 非 材 料 性 能 改变 或 外 部 提供 额外 的 冷却 。 基 于 硬件 的 闭环 控制 器 可 以 影响 
系统 的 热 输出 ， 这 就 是 基于 硬件 的 DTM 机 制 都 有 一 个 应 急 关 断 模式 的 原因 。 不 
得 不 说 的 是 ， 闭 环 反馈 控制 机 制 也 已 经 在 热管 理 的 冷却 系统 中 得 到 应 用 ， 如 冷却 
JU PEE S 
3.5.1.2. 配置 反馈 控制 器 的 线性 二 次 型 调节 算法 
在 本 章 中 讨论 的 状态 空间 作为 一 种 手段 ， 可 以 将 不 精确 或 不 完整 的 温度 传 感 
器 测量 值 映射 到 一 个 更 精细 的 热 分 布 。DTM 控制 器 的 传递 函数 可 以 用 同样 的 方 
式 表 达 ， 线 性 反馈 控制 系统 可 以 通过 这 种 表示 来 描述 。 线 性 离散 时 间 形 式 的 状态 
空间 可 通过 式 (3.22) 及 式 (3.23) 表示 ， 即 
x[n*1] 2Ax[ n] * Bu[ n] * Noó[ n] (3. 22) 
yLn] =Cx[n] * Du[n] +oln] (3. 23) 
RP, s[n] 表示 受 控 设 备 的 状态 〈 如 温度 ) ; u[n] 代表 系统 输入 (如 频率 和 
电压 ) ; y[n] 代表 系统 输出 。 两 个 方程 中 都 有 误差 项 ， 用 来 表示 系统 模型 的 不 
准确 性 和 系统 的 反馈 噪声 。 这 种 线性 反馈 系统 可 以 用 于 热管 理 系统 ， 构 成 比例 增 
益 。 控 制 器 中 存在 一 个 比例 增益 系数 KK， 最 大 限度 地 减少 反馈 系统 的 性 能 度量 
(成 本 函数 )。 反 馈 系 统 的 目标 是 由 成 本 函数 J(u) 定义 ， 表 示 由 控制 器 采取 行 
动 的 奖励 /开销 ， 这 取决 于 系统 的 状态 x [n] 和 控制 器 输出 ul nj。 
建立 成 本 函数 并 找到 使 之 最 小 化 的 增益 系数 算法 ， 称 为 线性 二 次 型 调节 器 的 
算法 (LQR)。 一 种 用 LQR 配置 DTM 控制 系统 的 应 用 已 被 提出 1%] 。 在 这 个 特 
定 的 系统 中 ， 处 理 器 的 工作 频率 控制 在 最 佳 性 能 功 耗 的 折 中 点 ， 同 时 保持 温度 低 
T BÀ ELS 
目标 函数 Ju) 对 应 于 一 个 一 般 的 状态 空间 ， 表 示 (消除 噪声 的 简化 后 ) 
如 下 : 


J(u) = [n]'Qx[n] + u[n]'Ru(n]) (3. 24) 
例如 ， 和 第 一 项 就 代表 控制 融 
的 作用 ; 第 二 项 矩阵 民 表示 由 控制 器 输入 信号 u(n) 提供 的 频率 设 定 导致 的 功率 
消耗 。 当 性 能 量度 通过 整个 时 间 斥 度 评价 时 ， 这 种 方法 称 为 无 限时 域 离 散 LQR。 
如 果 受 限于 有 限 的 时 间 步 长 ， 则 成 为 有 限 域 的 离散 时 间 LOR, 
对 于 热管 理 而 言 ， 成 本 函数 的 优化 问题 受 最 小 和 最 大 允许 时 钟 频率 范围 的 限 
制 ， 同 时 还 受 一 个 与 时 钟 频率 相关 的 量 u[n] 的 影响 , 另外 也 受到 描述 系统 状态 
表示 的 方程 的 影响 [ 见 式 (3.22) 和 式 (3.23)]。 控 制 器 的 反馈 回路 所 使 用 的 
最 优 增益 因子 K, 使 该 成 本 函数 最 小 化 ， 可 以 推导 为 : 


XE 集成 电路 热管 理 ， 片 上 和 系统 级 的 监测 及 冷却 


K, = (Be SBec +R)! (Be SA ) (3. 25 ) 
AP, HEME B 和 4, 是 状态 空间 ， 表 示 B 和 4 的 等 效 和 矩阵， 用 于 调整 热管 理 系 
统 的 采样 周期 ; S 是 一 个 正定 矩阵 ， 是 通过 求解 离散 黎 卡 提 代 数 方程 求 得 。 
最 终 ， 线 性 回路 控制 系统 可 以 执行 以 下 规则 : 
u|n] = Reference FREQ -KyxL E] (3. 26) 


3.5.2 随机 控制 


从 温度 传感器 测量 得 到 的 观测 值 的 不 确定 性 以 及 转换 电路 和 通信 接口 中 的 附 
加 噪声 使 得 控制 器 的 输入 具有 随机 性 质 。 基 于 以 上 原因 ， 随 机 控制 机 制 已 经 可 用 
于 DTM 问题 。 随 机 控制 将 观察 到 的 状态 视 为 具有 一 些 假 定 概率 分 布 的 随机 变量 。 
此 外 ， 在 热管 理 的 情况 下 ， 变 量 是 离散 时 间 变 量 。 然 后 ,控制 右 的 目标 是 最 小 化 
期 望 状态 和 观测 状态 之 间 的 误差 期 望 值 ， 例 如 温度 极限 和 观察 温度 。 随 机 控制 的 
一 个 实现 方法 是 通过 马尔 可 夫 过 程 ， 可 以 被 视 为 马尔 可 夫 链 的 延伸 。 马 尔 可 夫 链 
AUT Hon PIS (5,, ocn, s). 有 限 集合 组 成 的 随机 过 程 。 根 据 已 知 的 概率 分 
布 ， 从 给 定 状态 # 开 始 的 系统 将 具有 根据 已 知 概率 分 布 向 该 组 中 的 另 一 状态 转换 
的 预定 概率 。 马 尔 可 夫 过 程 通过 引入 两 个 新 概念 来 扩展 此 系统 : 动作 (或 选择 ) 
和 奖励 〈 或 成 本 ) 。 

在 每 个 状态 中 ， 控 制 器 现在 可 以 有 多 个 选择 并 响应 特定 选择 。 选 择 过 程 将 以 
一 定 的 概率 过 渡 到 新 的 状态 。 在 这 种 情况 下 ， 转 移 概 率 (TP) 不 仅 由 全 局 固定 
的 分 布 决定 ， 而 且 取 决 于 采取 的 具体 行动 。 但 是 ， 过 渡 仍 是 独立 于 过 去 的 状态 ， 
因此 它 也 是 过 去 的 选择 。 此 外 ， 每 个 选择 都 与 奖励 有 关 。 

TP(s; ,a,s;) =P(s(t+1)) =sjla(t) -aVs(t) =s; (3.27) 

控制 器 的 任务 是 实施 一 项 规则 ， 通 过 使 相关 的 预期 成 本 〈 或 最 大 化 奖励 ) 
最 小 化 的 方法 将 过 程 转移 到 下 一 个 状态 。 解 决 这 个 问题 的 一 种 方法 是 通过 迭代 状 
态 、 执 行动 作 和 观察 的 所 有 可 能 的 组 合 ， 以 计算 它们 各 自 的 成 本 并 朝 着 最 小 成 本 
的 方向 转移 ， 并 且 继 续 计 算 其 状态 及 其 在 多 次 迭代 中 的 结果 成 本 ， 直 到 没有 进 一 
步 改善 为 止 。 总 是 将 成 本 计算 为 可 能 的 状态 和 具有 各 自 概 率 权重 动作 的 累积 量 ， 
并 最 终 用 所 谓 的 折 现 因子 y (通常 设置 为 接近 1 的 值 ) 进行 调整 。 

在 应 用 于 DTM 时 ， 状 态 将 对 应 于 受 控 装置 的 热 状态 ， 执 行动 作对 应 于 (E 
压 频率 值 ) 的 离散 设置 ， 为 此 过 程 模型 将 需要 引入 一 个 简化 的 假设 来 保持 计算 
效率 。 热 状态 不 能 过 于 精细 ， 因 为 会 导致 过 多 的 状态 数据 ， 所 以 建议 将 工作 温度 
范围 划分 为 三 个 子 范围 1 (例如 ， 低 温 范 围 为 环境 空气 温度 入 Ts TS 中 
间 温 度 范围 为 Tu << Tsensor < Tmediums FO UYE E] T medium << Tsensor < Tiimn， 高 温 范 
围 定义 了 触发 主动 降 频 的 阔 值 )。 控 制 过 程 的 总 体 流 程 如 图 3. 12 所 示 。 

随机 控制 器 的 基本 方法 可 以 有 变 体 。 与 热管 理 相关 的 一 个 变 体 来 自 观察 问 
题 。 当 热管 理 控制 絮 由 于 外 部 动态 因素 的 干扰 而 不 能 精确 地 观察 所 选 动作 对 热 状 
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图 3. 12 在 状态 之 间 引 入 TP 的 马尔 科 夫 过 程 模型 。 热 管理 器 考虑 各 个 状态 下 的 可 能 行为 ， 
然后 通过 规则 执行 状态 转移 。 其 结果 (奖励 或 成 本 ) 由 温度 反馈 来 评估 

态 的 直接 影响 结果 时 ， 可 能 发 生 这 种 情况 。 例 如 ， 在 最 近 一 次 切换 到 新 的 频率 和 
电压 设置 的 热 响应 〈 温 度 传感器 观察 到 的 ) 之 前 ， 工 作 负载 的 变化 可 能 导致 操 
作 系统 干预 ， 并 将 设备 置 于 空闲 状态 模式 ， 从 而 改变 了 热 响应 。 为 了 使 系统 符合 
马尔 可 夫 过 程 假设 ， 可 以 通过 将 每 个 状态 转换 为 置信 状态 来 重新 引入 可 观察 性 。 
它 在 每 个 状态 转换 时 进行 动态 更 新 。 置 信 状 态 人 允许 将 状态 定义 为 所 有 可 能 状态 的 
概率 组 合 ， 总 概率 等 于 1。 

强化 学 习 是 随机 控制 和 优化 的 另 一 个 途径 ， 近 年 来 吸引 了 越 来 越 多 的 关注 ， 
各 种 针对 高 性 能 处 理 器 和 芯片 '%,8 "0 的 系统 的 功 耗 和 性 能 优化 方法 被 提出 。 此 
方法 也 假设 了 马尔 可 夫 过 程 管理 基础 系统 。 然 而 ， 它 不 需要 过 程 分 布 概率 的 先 验 
知识 。 相 反 ， 监 控 执 行动 作 的 后 果 ， 随 着 时 间 的 推移 过 程 将 会 了 解 哪些 行为 会 有 
良性 的 (理想 的 ) 结果 ， 哪 些 行为 没有 良性 的 结果 。 


3.5.3 模型 预测 控制 


模型 预测 控制 (MPC) 是 另 一 个 有 吸引 力 的 控制 概念 ， 其 涉及 对 当前 时 间 
步 又 将 要 做 出 的 决定 所 产生 的 结果 进行 预测 。 除 了 传感器 反馈 之 外 ，MPC 方法 
还 需要 系统 的 模型 ， 以 及 模型 的 适当 轻 量 级 求解 器 〈 模 拟 咒 ) 在 线 预测 其 执行 
动作 。 事 实 上 ， 上 述 求解 器 还 包括 控制 器 负责 的 整体 优化 问题 。 例 如 ， 在 热管 理 
的 背景 下 ， 动 态 控制 需 旨 在 将 控制 功能 尽 可 能 地 接近 最 大 允许 功率 (达到 最 高 
频率 下 的 最 高 性 能 ) ， 而 最 终 的 热 态 不 应 超过 阔 值 。 在 这 种 状况 下 ， 系 统 的 热 模 
型 将 与 功率 性 能 指示 性 目标 函数 相 结合 ， 并 通过 伐 入 在 MPD 引擎 中 的 求解 器 来 
求解 由 此 产生 的 优化 问题 。 如 果 预 测 的 温度 与 执行 当前 决定 导致 的 最 终 温度 一 
致 ， 那 么 所 得 到 的 解决 方案 将 是 在 不 超过 安全 温度 限制 的 前 提 下 ， 输 入 到 系统 中 
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的 最 大 资源 分 配 ( 例 如， 党 片 的 功率 预算 )。DTM 的 MPC 概念 将 控制 系统 定义 
分 为 三 个 主要 块 : 中 频率 - 功率 块 : 确定 当前 工作 频率 和 工作 负载 下 的 最 大 允 
许 功 率 预 算 ; 人 @ 控 制 器 块 : 包含 观察 者 〈 如 温度 传 感 顺 ) 和 优化 求解 器 ;3) 接 
收 特 定量 的 功率 频率 块 : 由 控制 器 确定 要 在 下 一 个 执行 时 间 中 消耗 的 功率 ， 并 将 
其 转换 为 实际 时 钟 频率 设置 以 驱动 时 钟 电路 [01 。 


另 一 个 基于 MPC WITTE HEH 


区 域 ， 优 化 问题 都 可 以 离线 计算 并 存储 在 查找 表 中 。 


[8] 
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Wa 
主动 冷却 


集成 电路 芯片 的 片上 温度 传感器 是 主动 热管 理 系统 (DTM) 的 基本 组 成 部 
分 ， 通 过 工作 电压 和 频率 缩放 机 人 制 实现 系统 性 能 的 钳制 ， 由 此 对 功率 密度 和 热 响 
应 具有 最 直接 的 影响 。 但 是 有 时 候 ， 单 纯 的 性 能 钳制 不 足以 使 一 个 发 热 系 统 返回 
到 安全 的 工作 点 。 些 外， 即使 通过 钳制 设备 的 性 能 可 以 迫使 系统 回 到 安全 的 工作 
温度 ， 但 是 由 于 性 能 下 降 而 付出 的 代价 太 大 ， 也 让 人 无 法 接受 。 所 以 ， 需 要 通过 
主动 冷却 技术 的 干预 ,特别 是 对 于 高 利用 率 、 高 性 能 系统 设备 ， 在 不 损失 系统 性 
能 的 前 提 下 ， 使 得 设备 工作 在 安全 温度 范围 内 。 此 外 ， 在 预 部 署 功 能 测试 和 老化 
测试 过 程 中 ,冷却 也 是 至 关 重 要 的 ， 此 时 芯片 会 受到 高 于 平均 水 平 热 应 力 的 冲 
击 。 为 了 实现 功能 测试 的 可 靠 性 ， 由 于 极端 热 应 力 的 作用 ， 世 片 不 应 再 经 受 瞬 态 
时 序 违 例 。 

主动 冷却 技术 通常 是 指 借助 额外 的 功率 输入 以 实现 热量 从 给 定 的 系统 向 外 界 
环境 空气 迁移 的 所 有 机 制 。 这 类 机 制 因为 它们 自 喘 工作 需要 消耗 一 定 的 能 量 , 例 
如 使 风 记 的 电动 机 驱动 风扇 扇 叶 转 动 、 液 体 冷 却 中 使 用 的 泵 和 制冷 单元 以 及 热电 
制冷 中 消耗 的 电流 。 它 们 驱动 热流 按照 特定 的 方向 离开 集成 电路 ， 并 最 终 传递 给 
散热 器 和 环境 空气 。 在 使 用 热电 制冷 技术 时 ， 利 用 热电 制冷 单元 上 消耗 的 输入 功 
率 ， 可 以 实现 一 个 负 有 效 热 阻 ， 从 而 达到 反 向 温度 梯度 的 目的 。 世 片 自身 的 片上 
温度 传 感 絮 也 可 以 参与 各 种 主动 冷却 技术 的 反馈 控制 回路 。 例 如 ， 很 多 服务 器 中 
使 用 的 中 央 处 理 顺 (CPU) 利用 自身 片上 温度 传 感 吉 的 读 值 确定 何 时 需要 冷却 风 
旋转 速 上 升 或 者 下 降 。 

在 主动 冷却 系统 中 一 种 被 广泛 使 用 的 评估 冷却 能 力 的 标准 是 发 热 核心 表面 和 
环境 空气 之 间 的 有 效 热 阻 值 0 。 式 (4.1) 表示 了 一 个 芯片 消耗 了 热 设 计 功率 大 
小 的 功 耗 ， 并 产生 热 设计 功率 大 小 的 热量 。 为 了 冷却 必 片 核心 上 产生 的 热量 所 期 
望 的 最 大 热 阻 值 为 
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Popp 
上 式 定 义 了 在 给 定 的 环境 温度 条 件 下 ， 系 统 功 耗 为 最 大 热 设计 功 耗 (TDP 
功 耗 ) 时 ， 为 了 使 核心 温度 不 超过 最 高 允许 温度 值 Taie 所 能 接受 的 最 小 散热 能 
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力 ， 这 也 可 以 理解 为 允许 系统 设备 可 以 在 非常 短 的 时 间 内 超过 最 大 热 设 计 功 耗 ， 
相应 地 芯片 的 核心 温度 超过 温度 上 限 值 Tu 而 达到 另外 一 个 安全 限 值 。 然 而 这 些 
非常 短暂 的 时 间 间隔 并 不 能 代表 系统 的 真实 负载 ， 它 们 只 是 个 例外 。 整 个 散热 过 
程 由 几 个 部 分 组 成 ， 其 中 包括 与 芯片 核心 物理 接触 的 所 有 被 动 热传导 路 径 ， 以 及 
周围 这 些 围绕 被 动 热传导 层 的 所 有 主动 冷却 机 制 。 有 效 热 阻 也 可 以 在 芯片 核心 与 
芯片 封装 过 体 之 间 以 及 芯片 封装 过 体 与 外 界 环境 之 间 一 层 一 层 的 定义 。 前 一 种 情 
况 ， 热 阻 直接 与 固体 (或 者 几 种 固体 的 组 合 ， 的 热传导 有 关 ， 包 括 层 赤 在 芯片 
核心 和 封装 壳 体 之 间 的 所 有 材料 层 ， 而 后 一 种 情况 ， 热 阻 比较 抽象 ， 与 所 选择 的 
主动 冷却 方法 的 能 力 有 关 ， 比 如 在 热管 内 部 、 设 备 外 壳 、 机 箱 、 机 架 或 者 机 柜 内 
部 创建 的 热 对 流 路 径 〈 取 决 于 处 理 器 芯片 的 具体 目标 产品 和 部 署 方法 ) 。 

随 着 现代 处 理 器 芯片 中 的 局 部 热点 越 来 越 显著 ， 已 经 引入 了 新 的 判断 指标 ， 
用 于 区 分 在 芯片 发 热 面积 上 功率 密度 均匀 分 布 的 芯片 以 及 发 热 功 率 和 热流 密度 更 
加 局 部 集中 分 布 的 芯片 5] 。 这 一 指标 旨 在 判定 散热 解决 方案 冷却 每 单位 面积 积 
累 的 热量 的 能 力 及 冷却 非 均匀 分 布 功率 密度 的 效率 。 这 一 衡量 指标 参数 被 称 为 核 
心 到 壳 体 密度 因子 (DF ) ， 定 义 为 


RE 
DE Se = Guam 
WP, GR FRAY EELS S] 5D AB I S BEARER, UE UTS Fre Ko Ta A 
芯片 核心 到 壳 体 表面 的 热 阻 值 。 

在 下 文中 ,我 们 将 介绍 主要 的 主动 冷却 机 制 以 及 它们 支持 的 从 传感器 接收 反 
馈 信 号 的 类 型 。 接 下 来 的 讨论 将 从 最 常见 的 ， 也 许 是 最 不 复杂 的 主动 冷却 技术 
( 即 空气 冷却 技术 ) 开始 ， 然 后 讲述 已 经 在 HPC 系统 的 处 理 右 蕊 片上 得 到 商业 应 
JH (比如 超级 计算 机 ) 液体 冷却 技术 ， 最 后 将 讨论 新 兴 领 域 -热电 冷却 技术 。 


4.1 空气 冷却 


强迫 空气 冷却 是 首要 的 、 也 是 最 广泛 应 用 的 主动 冷却 技术 。 冷 却 风 户 以 各 种 
形状 安装 在 系统 中 的 不 同位 置 。 如 图 4. 1 所 示 ， 一 些 散 热 器 也 和 冷却 风扇 集成 在 
一 起 。 在 散热 器 的 顶部 放置 一 个 冷却 风扇 ， 使 得 垂直 的 冷却 空气 吹 向 散热 名， 这 
种 冷却 方式 通常 被 称 为 冲击 冷却 。 通 常 有 两 种 方式 可 以 把 风 鹿 和 散热 器 组 合 在 一 
起 。 图 4. 1 所 示 是 把 冷却 风扇 直接 回 定 在 散热 需 的 项 部。 此 外 ， 为 了 使 整个 模 组 
更 加 紧凑 ， 尤 其 为 了 减 小 整个 模 组 结构 的 高 度 ， 散 热 器 的 翅 片 被 设计 成 针 状 翅 
F, KARRERA IAR, AEA PoE ER, 
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冷却 风扇 除了 和 散热 器 集成 
在 一 起 ,通常 还 可 以 固定 安装 在 
发 热 设 备 壳 体内 的 通风 孔 上 ， 用 
于 吸入 冷却 空气 或 者 把 热 空气 吹 
出 壳 体 。 在 机 柜 内 部 或 者 机 架 上 
也 安装 有 冷却 风 肩 ， 用 于 为 电路 
板 或 者 功率 调节 器 提供 冷却 气 
流 153] 。 在 某 个 给 定 的 系统 内 ， 在 
详细 分 析 系 统 的 气流 分 布 和 需要 
冷却 的 热源 后 ， 冷 却 风扇 在 系统 
内 的 布局 和 摆 放 位 置 会 得 到 进 一 
步 的 优化 和 改善 。 其 他 几 个 因 
素 ， 比 如 尺 十 大小、 连接 器 、 器 
件 的 高 度 、 外 部 接口 等 都 会 影响 
最 终 的 系统 布局 以 及 系统 冷却 方 
案 的 冷却 效率 。 

扩展 散热 器 结构 的 另外 一 种 方法 是 利用 热管 创建 远 端 散热 器 ， 也 可 以 称 之 为 
远程 换 热 器 ， 以 提高 强迫 空气 冷却 的 效率 [和 。 这 种 结构 的 散热 器 基本 上 都 是 将 
附 接 在 芯片 上 的 局 部 散热 金属 块 与 放置 在 系统 远 端 的 另 一 个 散热 器 相连 ， 附 接 在 
发 热 芯片 端的 热管 把 热量 传递 给 远 端 的 换 热 器 。 热 管 由 工作 液体 〈 对 于 冷却 处 
理 器 用 热管 ， 工 作 液体 一 般 为 水 ) 和 内 部 的 毛细 结构 (比如 在 管道 内 壁 上 刻 蚀 
的 槽 道 结 构 或 者 烧结 粉末 材料) 组成。 液体 在 热管 的 吸 热 端 吸 收 热量 后 转变 成 
蒸气 ， 并 且 经 由 毛细 结构 被 吸 回 到 热 交 换 器 中 用 于 冷凝 。 被 传递 到 换 热 器 的 热量 
被 流 过 换 热 器 翅 片 的 冷却 空气 带 走 。 热 管 的 有 效 热传导 率 远 超过 铜 的 热传导 率 。 
此 类 结构 的 散热 装置 已 应 用 于 冷却 笔记 本 电脑 ， 例 如 使 用 英特尔 赛 扬 M ABT 
的 计算 机 ， 以 及 使 用 诸如 酷 害 生 、i7 和 至 强 处 理 器 系统 。 

在 实际 应 用 过 程 中 ,冷却 风扇 定义 了 几 个 规格 参数 ,包括 尺寸 大 小 ( 半 
径 ) 、 风 扇 电动 机 的 转速 (RPM) 、 空 气流 量 以 及 自身 需要 的 输入 功率 。 在 系统 
内 不 同 的 位 置 选择 使 用 不 同 具体 类 型 的 风扇 ， 根 据 风 扇 的 不 同 具体 类 型 冷却 风扇 
的 转速 (RPM) 也 会 有 所 不 同 。 

与 散热 器 集成 在 一 起 的 较 小 类 型 的 风扇 ， 尺 十 一般 介 于 30 ~ 60mm。 安 装 在 
电路 板 或 者 机 柜 中 的 较 大 的 风扇 ， 根 据 具 体 的 冷却 要 求 和 可 用 空间 ， 直 径 一 般 在 
40 «360mm 之 间 。 风 扇 转 速 直接 影响 到 冷却 的 功率 ， 用 于 冷却 处 理 器 芯片 的 风 
而 转速 一 般 在 1000 ~ 4000r/min， 而 专门 用 于 其 他 部 件 (例如 硬盘 、 显 卡 ) 的 风 
扁 和 用 于 系统 内 的 风扇 可 能 具有 更 高 的 转速 。 风 扇 产 生 的 静 压 力 (SP) 以 及 风 


图 4.1 集成 有 冷却 风扇 的 散热 器 。 空 气 首先 经 过 
风扇 往 下 流动 ， 最 终 穿 过 散热 器 的 翅 片 
流 到 散热 右 的 外 部 
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扇 提供 的 空气 流量 有 助 于 确定 冷却 的 效率 。 风 扇 的 静 压 力 (SP) 用 于 风扇 抵抗 
系统 阻力 和 障碍 物 对 气流 路 径 的 影响 。 所 以 ， 更 高 静 压 力 的 风扇 可 以 迫使 相同 体 
积 流量 的 空气 通过 更 紧密 的 空间 和 /或 障碍 物 。 因 此 ， 对 于 有 限 空间 的 冷却 ， 风 
扇 的 静 压 力 能 更 直接 评估 对 其 的 冷却 效率 ， 比 如 风扇 固定 安装 在 散热 器 上 的 模 
组 。 因 此 ， 更 高 静 压 的 风扇 在 这 种 情形 下 更 受 青睐 。 空 气 冷 却 系统 中 的 压力 通常 
以 毫米 (或 者 英寸 ) 水 柱 (毫米 HO) 为 单位 来 衡量 ， 这 是 指 在 4% 条件 下 施 
加 在 1mm 高 度 水 柱 的 底面 上 的 压力 。 大 流量 的 风扇 通常 更 适合 无 障碍 或 者 较 小 
受 限 空间 的 冷却 ， 比 如 安装 在 机 架 上 的 风扇 和 机 柜 中 的 风扇 。 空 气流 量 定义 为 每 
单位 时 间 内 提供 的 空气 体积 ， 通 常 使 用 每 分 钟 立方 英尺 (CFM) 为 单位 。 

对 于 一 个 具有 特定 冷却 需求 和 已 知 空气 流量 的 系统 ， 可 以 选 配 一 个 可 以 提供 
寺 定 空气 压力 和 流量 的 风扇 ， 例 如 不 同型 号 的 英特尔 多 核 至 强 @ 处 理 器 主板 的 气 
流 阻 抗 介 于 0. 14 ~ 0. 406ftS 水 柱 之 间 。 图 4. 2 说 明了 风扇 冷却 能 力 与 系统 冷却 需 
求 之 间 的 关系 ， 任 何 风扇 可 以 在 系统 阻抗 决定 的 压力 大 小 条 件 下 输出 一 定 流量 的 
气流 。 图 4. 2a 描述 了 在 一 定 范围 空气 流量 条 件 下 散热 器 的 阻抗 ， 同 时 还 描述 了 
风扇 的 性 能 曲线 ， 在 一 定 的 系统 阻抗 条 件 下 提供 特定 大 小 的 空气 流量 。 我 们 假设 
按照 散热 器 的 热 设计 要 求 需要 对 应 于 Al 的 空气 流量 ， 图 4. 2a 所 示 的 风扇 不 能 满 
足 这 一 要 求 。 缓 解 这 一 点 的 方法 是 改善 散热 器 的 阻抗 ， 在 该 图 中 用 虚线 表示 。 这 
可 能 涉及 使 用 更 高 效 的 材料 制作 散热 器 ， 或 者 改变 散热 器 的 几何 形状 等 。 另 一 个 
选择 如 图 4. 2b 所 示 ， 原 风扇 由 更 高 性 能 的 风扇 替代 ， 能 在 不 改变 散热 器 的 情况 
下 提供 Al 的 空气 流量 。 这 可 能 会 涉及 使 用 尺寸 更 大 、 功 耗 更 高 的 风扇 等 。 
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图 4.2 确定 冷却 风扇 的 技术 规格 ,考虑 受 系统 阻抗 的 影响 ， 
给 定 风 扇 的 性 能 与 系统 所 需 最 小 气流 量 之 间 的 关系 
a) 如 果 风 扇 的 静 压 力 和 提供 的 气流 量 不 能 满足 系统 对 气流 量 的 要 求 ， 
一 个 方法 是 改善 ( 减 小 ) 系统 的 阻抗 ， 降 低 散热 器 的 阻抗 曲线 
b) 另 一 个 方法 是 选择 更 高 性 能 的 风扇 ， 提 高 风扇 的 性 能 曲线 
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利用 下 面 的 换 热 方程 ， 可 以 估算 出 特定 冷却 要 求情 况 下 需要 的 空气 流 
EP 
Q =CF WAT (4.3) 
NF, Q 表示 换 热 量 ; Cs" 表示 空气 的 比热容 ;多 表示 空气 流 的 质量 ; AT 表示 
气流 进口 与 出 口 之 间 的 温度 差 。 根 据 下 式 可 以 计算 出 空气 流 的 质量 : 
W = Airflow x Density (4.4) 
对 这 些 关 系 式 进行 重新 处 理 后 ， 可 以 得 出 计算 给 定 散 热量 和 温度 差 条 件 下 需 
要 的 空气 流量 ， 如 下 式 所 示 : 


Airflow =a Power (4.5) 


如 果 温 度 单位 为 华氏 度 ， 则 系数 a 取 3.2; 如 果 温 度 单位 为 摄氏 度 ， 系 数 a 
取 1.78!51 。 系 统 消耗 的 热 功率 直接 与 其 产生 的 热量 有 关 ， 因 此 ， 系 统 中 消耗 的 
功率 用 Q 表示 。 

据 报 道 ， 一 个 戴尔 15 ~ 25 kW 功 耗 的 高 密度 刀片 服务 器 机 箱 ， 需 要 2000 
CFM 的 空气 流量 来 对 系统 进行 冷却 !6] 。 另 外 6 个 7U 刀片 服务 器 机 框 ， 系 统 功 耗 
为 18 kW, E 2500 CFM 的 空气 流量 来 冷却 系统 [7] 。 

风 忆 转速 与 风扇 压力 、 流 量 之 间 的 关系 可 以 用 式 (4.6) 和 式 (4.7) 来 表 
示 。 从 下 面 的 关系 式 中 可 以 看 出 ， 空 气流 量 与 风 记 的 转速 呈 线 性 关系 ， 静 压力 与 
风扇 转速 成 二 次 方 关 系 。 


di _ RPM, . 
irflow, = ppm, o (4.6) 
RPM, YY 
SP, = Z | SP 4.7 
? (erac. : veld 


冷却 风扇 消耗 的 功 耗 与 其 自身 的 转速 直接 相关 ， 而 风扇 转 速 又 由 系统 所 需 的 
空气 流量 决定 。 提 供给 风扇 的 输入 功率 可 以 从 它 的 技术 规格 书 计 算得 到 ， 其 为 工 
作 电 压 和 风扇 电动 机 在 给 定 转 速 下 消耗 的 电流 大 小 的 乘积 ， 即 

P E = Van Tan (4.8) 

风扇 的 输出 功率 可 以 表示 为 其 提供 的 空气 压力 和 流量 的 函数 ， 即 

Pressure(inchH,O) x Airflow( CFM) 


out — 8.5 (4. 9) 
最 后 ， 风 扇 的 效率 可 以 定义 为 其 输出 功率 与 输入 功率 的 比值 ， 即 
P. 
Man = 5 (4. 10) 


Pos 
对 于 在 其 规格 书 中 具有 特定 效率 的 风扇 ， 可 以 使 用 其 提供 的 风扇 效率 和 输出 
功率 的 乘积 来 计算 风扇 消耗 的 功率 。 由 于 风扇 静 压 和 流量 ( 风扇 输 出 功率 的 两 
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个 变量 ) 分 别 与 风扇 的 转速 呈 二 次 方 和 线性 关系 ， 所 以 风扇 消 耗 的 功率 可 近似 
与 风扇 转 速成 三 次 方 关系 。 高 端 1U 机 架 服务 器 冷却 风扇 所 消耗 的 功 耗 可 以 达到 
40W!58!, 2U 机 架 服务 器 风扇 所 消耗 的 功 耗 甚至 可 以 超过 200W 92, AVL 
(包括 处 理 器 、 内 存 芯片， 和 IO 组 件 的 风扇 ) 对 系统 总 功 耗 的 贡献 可 以 与 处 理 
器 相 媲美 ， 达 到 总 功 耗 的 51% fl 。 

除了 风扇 的 性 能 规格 之 外 ， 还 有 一 个 更 重要 的 参数 就 是 风扇 的 噪声 。 噪 声 影 
响 用 户 的 使 用 体验 ， 尤 其 对 台式 计算 机 和 笔记 本 电脑 而 言 。 虽 然 由 噪声 引起 的 不 
适 是 主观 的 ， 但 是 风扇 工作 状况 对 噪声 的 相对 影响 可 以 用 分 贝 (dB). 来 量化 。 
风扇 转速 是 影响 噪声 的 最 重要 的 因素 ， 它 可 以 通过 下 面 的 关系 式 表 示 上 1 : 

Noise, (dB) = Noise; (dB) +50 x logy, Er (4. 11) 

将 风 书 转速 提高 50% ， 相 应 的 噪声 会 增加 约 8. 8dB 。 另 一 项 研究 表明 ， 随 着 
空气 流速 增加 52% ， 噪 声 水 平 将 增加 约 10dBL2] 。 回 顾 前 文中 所 提 到 的 ， 空 气 
流量 与 风扇 转速 呈 线 性 关系 ， 上 述 数 据 与 式 (4.11) 所 计算 的 结果 基本 一 致 。 

总 的 来 说 ， 强 迫 空气 冷却 技术 作为 整体 热 设 计 方法 的 一 部 分 ， 进 行 了 系统 优 
化 设计 ， 其 中 全 竺 分 析 系 统 的 阻抗 应 在 考虑 尺寸 大 小 和 系统 布局 限制 的 同时 做 到 
尽 可 能 的 小 ; @ 针 对 给 定 阻抗 和 空气 流量 要 求 的 系统 ， 选 择 具 有 最 佳 性 能 和 效率 
与 之 相 匹 配 的 风扇 ，@) 冷 却 风扇 在 运行 过 程 中 一 直 在 进行 动态 管理 ， 以 求 使 转速 
尽 可 能 地 低 ， 这 样 风 扇 工 作 噪声 也 能 做 到 最 低 ， 同 时 更 重要 的 是 风扇 的 功 耗 也 最 
低 。 显 然 ， 满 足 该 目标 的 同时 ， 也 使 系统 噪声 达到 最 低 。 为 了 实现 系统 的 低 品 
声 ， 同 时 使 得 系统 风扇 所 消耗 的 功 耗 最 低 ， 目 前 存在 多 种 管理 风扇 转速 的 逻辑 机 
制 ， 包 括 散 热 器 上 的 风扇 以 及 机 箱 、 机 柜 中 的 风扇。 下 文 将 逐步 介绍 这 些 风 肩 的 
管理 机 制 和 方法 。 


4.1.1 冷却 风扇 的 管理 控制 


因为 认识 到 冷却 风扇 对 系统 总 功 耗 的 影响 ， 一 些 人 研究 主要 集中 在 有 效 地 控制 
管理 风扇 的 转速 ， 以 适应 系统 散热 需 的 不 同 冷却 需求 。 

其 中 方法 之 一 是 将 散热 器 的 有 效 热 阻 表达 成 风扇 转速 的 国 数 (es XU FE 
速 就 会 降低 散热 器 的 有 效 热 阻 ) ， 并 将 其 作为 可 变 参数 来 管理 ， 同 时 维持 散热 器 
的 温度 在 期 望 的 水 平 031 。 随 后 ， 提 出 了 一 种 控制 算法 以 使 系统 功 耗 达 到 最 小 。 
其 由 处 理 融 的 动态 功 耗 、 与 处 理 融 温度 相关 的 漏电 功 耗 以 及 风扇 功 耗 组 成 ， 这 是 
通过 动态 地 联合 优化 风扇 的 转速 、 处 理 顺 的 工作 电压 和 频率 大 小 来 实现 的 。 可 以 
采用 一 种 理论 控制 方法 ， 这 种 方法 通过 实时 的 温度 探测 来 激活 启用 反馈 控制 回 
路 。 每 次 温度 传 感 天 报告 系统 过 热 ， 一 个 优化 性 问题 即 可 得 到 解决 以 确定 系统 的 
能 量 最 优化 设置 〈 如 风扇 转速 、 工 作 电 压 / 频 率 的 设置 ) ， 并 保持 这 种 设置 直到 
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当前 任务 完成 或 者 温度 传感器 报告 触发 另外 一 种 温度 安全 门限 。 

之 前 提出 了 一 种 用 于 刀片 服务 器 的 多 输入 和 多 输出 的 风 户 控制 器 "1] 。 该 控 
制 融 优化 的 目的 是 使 服务 器 机 箱 内 所 有 风扇 的 功 耗 最 小 ， 同 时 使 每 个 刀片 服务 顺 
上 报 的 最 高 核心 温度 保持 在 安全 净值 以 内 。 此 外 ， 风 扇 转 速 有 最 低 转 速 和 最 高 转 
速 的 限制 ， 控 制 咒 的 优化 是 在 动态 过 程 中 解决 的 ， 以 适应 系统 工作 负载 随时 间 的 
不 断 变 化 。 可 以 利用 三 阶 多 项 式 描 述 风 扇 转 速 与 风 鹿 功 耗 之 间 的 三 次 方 关系 。 为 
了 优化 这 个 非 线性 问题 ， 它 被 分 解 成 了 两 个 子 问题 。 第 一 个 阶段 是 确定 每 个 单独 
的 刀片 服务 器 需要 的 最 小 冷却 风量 ， 以 将 其 芯片 核心 温度 保持 在 规定 的 阔 值 以 
内 ， 每 个 刀片 所 需要 的 最 小 空气 流量 均 应 控制 在 风扇 的 最 大 可 提供 的 流量 范围 以 
内 。 一 旦 每 个 刀片 服务 器 所 需要 的 最 小 空气 流量 确定 以 后 ， 在 第 二 个 阶段 中 解决 
整体 的 优化 问题 ， 采 用 二 分 查找 算法 在 最 小 需求 流量 和 最 大 可 用 流量 定义 的 范围 
内 通过 迭代 实现 。 

有 一 种 风扇 控制 顺 ， 通 过 连续 监测 处 理 器 和 风扇 的 功 耗 来 调节 风扇 的 转速 以 
优化 系统 功 耗 :5] 。 服 务 器 系统 的 广泛 特征 是 可 以 在 不 同 水 平 的 系统 利用 率 情况 
下 ， 收 集 单 个 处 理 器 和 风扇 的 功 耗 及 其 对 应 的 处 理 需 温度 。 可 以 用 一 些 特殊 的 基 
准 程序 软件 来 对 系统 施加 压力 ， 使 系统 运行 在 不 同 的 负载 水 平 。 在 这 些 基准 程序 
软件 运行 过 程 中 ， 收 集 系统 运行 的 功 耗 、 温 度 和 风 遍 转速 数据 ， 然 后 用 于 进行 模 
型 拟 合 ， 以 生成 处 理 需 基于 利用 率 的 有 功 功率 函数 模型 和 基于 温度 的 漏电 功率 函 
数 模型 。 由 于 在 程序 运行 期 间 ， 系 统 会 连续 不 断 地 扫描 不 同 的 风扇 转速 ， 因 此 对 
于 各 个 不 同 的 系统 利用 率 ， 还 会 识别 出 使 系统 功 耗 最 小 的 最 佳 风 鹿 转 速 。 使 用 这 
些 拟 合 模型 生成 LUT， 可 表明 在 不 同系 统 利用 率 情 况 下 的 风扇 转速 均 使 得 整个 系 
统 功 耗 达 到 最 佳 水 平 。 在 系统 运行 时 ， 系 统 利用 率 被 频繁 地 轮 询 (每 秒 钟 轮 询 
一 次 ) LUT 控制 器 来 确定 最 佳 的 风扇 转速 。 在 该 风扇 控制 逻辑 方法 中 ， 依 靠 系 
统 利用 率 而 不 是 直接 利用 温度 测量 是 合理 的 。 利 用 率 的 变化 趋势 可 以 提早 预示 即 
将 发 生 的 热 故 障 ， 并 且 系统 能 够 主动 地 做 出 反应 。 另 一 方面 ， 风 扇 控 制 器 可 以 对 
瞬时 或 者 短期 的 峰值 利用 率 做 出 反应 ， 及 时 提高 风扇 的 转速 ， 并 且 使 风扇 高 转速 
持续 的 时 间 比 所 需要 的 时 间 更 和 久 。 

最 近 的 一 项 研究 回 到 了 利用 在 线 温度 传感器 测量 温度 数据 来 控制 风扇 转速 。 
然而 ， 由 于 获得 传感器 的 温度 读 值 和 确定 量化 误差 的 等 待 时 间 而 引起 的 缺陷 ， 可 
能 会 导致 依赖 于 这 些 传 感 融 的 控制 融 的 稳定 性 问题 。 这 项 研究 主要 集中 在 通过 风 
扇 转 速 振荡 表示 的 风扇 动态 控制 方案 的 稳定 性 0 。 为 了 保证 风扇 控制 的 稳定 
性 ， 引 入 了 PID 控制 器 。PID 控制 器 在 上 +1 步 的 响应 函数 由 三 个 子 项 组 成 ， 每 
个 子 项 通过 增益 系数 进行 比例 缩放 。 它 们 分 别 是 : 中 反应 温度 测量 值 偏 移 的 比例 
增益 系数 ; @ 反 应 温度 测量 值 分 解 到 第 正 步 的 积分 增益 系数 ; @ 反 应 最 近 两 次 温 
度 测 量 误差 的 微分 增益 系数 。 首 先 在 不 确定 风 户 转速 振荡 的 稳定 状态 下 考察 系 
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统 ， 仅 通过 调整 比例 增益 系数 ， 使 系统 维持 在 该 状态 。 可 以 衡量 风扇 的 振荡 周 
期 ， 并 确定 出 全 局 增益 系数 。 使 用 振荡 周期 和 全 局 增益 系数 这 两 个 值 ， 通 过 Zie- 
gler — Nichols 闭环 调谐 方法 分 别 计 算出 三 个 增益 系数 id o 

另 一 个 用 于 高 密度 服务 器 风 书 转速 的 PID 控制 器 由 在 实现 风扇 控 制 的 自 整 
SELS], PID 神经 网 络 用 于 在 线 调 节 PID 控制 器 的 增益 系数 。 与 先前 的 其 他 方法 
类 似 ， 利 用 三 阶 多 项 式 将 风扇 消耗 的 功 耗 拟 合成 风 户 转速 的 函数 。 控 制 器 的 目的 
是 在 4 Al ty 时 间 段 内 使 风扇 消耗 的 功 耗 达 到 最 小 。 不 同 于 以 前 的 PD 控制 ， 它 
使 用 静态 参数 调谐 方式 。 该 PID 控制 方法 利用 神经 网 络 的 在 线 学 习 方法 实现 增益 
系数 的 调谐 。 事 实 上 ， 三 层 神 经 网 络 的 中 间 层 结构 中 包含 有 实际 的 PID fitis o 

基于 在 线 学 习 的 方法 强调 了 风扇 转速 与 系统 漏电 功 耗 之 间 的 关系 [9 。 由 于 
风 届 转速 影响 温度 ， 进 而 影响 漏电 功 耗 ， 因 此 存在 某 一 个 最 优 的 风扇 操作 点 ， 使 
得 风扇 和 系统 漏电 功 耗 达 到 最 小 。 在 某 个 给 定 系统 负载 的 初始 阶段 ， 风 旋转 速 控 
制 方法 利用 “ 怜 山 ” 算 法 来 训练 控制 器 以 获得 最 优 风扇 转速 。 在 这 个 初始 阶段 
运行 时 间 内 ， 假 定 工作 负载 是 稳定 的 ， 并 具有 一 定 的 代表 性 。 此 方法 适合 高 性 能 
计算 应 用 场景 ,工作 系统 长 时 间 保 持 运行 。 在 控制 右 完 成 学 习 阶段 之 后 ， 风 肩 转 
速 一 直 保持 在 该 阶段 确定 的 转速 ， 直 到 检测 到 工作 负载 发 生 显著 的 变化 。 假 定 用 
于 查找 最 佳 风扇 转 速 的 空间 位 于 凸 空间 中 ， 基 本 上 “把 山 ”算法 通过 从 任意 初 
始 解 开始 在 该 空间 内 执行 查找 ， 每 次 通过 重新 定位 查找 的 中 心 点 来 搜索 邻近 的 空 
间 ， 从 而 找到 最 佳 的 风扇 转 速 。 此 外 ， 通 过 以 不 同方 式 限制 邻近 的 空间 ， 从 而 达 
到 限制 查找 所 需要 的 时 间 的 目的 。 

一 种 用 于 服务 器 的 实时 风扇 控制 器 ， 采 用 了 简化 的 热学 模型 来 预 估 某 给 定 的 
空气 质量 流量 对 服务 器 温度 的 影响 :2 。 使 用 适当 的 正 交 分 解法 来 导出 简化 模 
型 ， 该 模型 基于 给 定 的 热量 具有 一 个 目标 温度 和 目标 空气 质量 流量 ， 该 方法 就 是 
模型 降 阶 法 。 得 到 的 控制 器 将 所 测量 到 的 系统 温度 和 处 理 器 功率 作为 输入 ， 并 将 
其 应 用 于 紧凑 模型 以 导出 控制 空气 流质 量 。 基 于 空气 流质 量 的 初始 预 佑 值 ， 估 算 
出 对 应 的 温度 值 。 如 果 估 算 的 温度 值 在 系统 设备 制造 商 设 定 的 参考 温度 的 预定 义 
误差 之 内 ， 则 将 空气 流 的 质量 转换 为 对 应 的 工作 电压 来 驱动 风扇 运转 。 如 果 佑 算 
的 温度 远 低 于 参考 温度 ， 则 稍微 减少 空气 流 的 质量 ， 并 重复 进行 温度 估算 。 类 似 
地 ， 如 果 佑 算 的 温度 值 比 参考 温度 高 出 很 多 ， 则 稍微 增加 空气 流 的 质量 。 如 果 需 
要 ， 这 个 内 部 循环 需要 重复 几 次 迭代 才能 得 到 准确 的 预 佑 温度 。 

关于 冷却 风 户 运行 的 各 个 方面 的 优化 ， 人 们 已 经 做 过 研究 ， 包 括 由 于 风 遍 转 
速 的 突然 变化 引起 的 声学 噪声 的 升 高 ， 风 扇 的 输入 工作 电压 控制 方面 的 选择 
[调节 器 vs 脉冲 宽度 调制 (PWM) ] 。 通 过 检测 风扇 的 转速 信号 以 精细 颗粒 度 检 
测 风 扇 转 速 相 较 于 定义 粗 颗粒 度 的 转速 步 长 来 检测 风扇 转速 两 者 之 间 的 选择 ， 以 
及 设置 最 佳 温度 点 以 触发 提高 风扇 转速 来 防止 即将 发 生 的 热 故 障 121]。 
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正如 我 们 在 许多 风扇 优 化 方法 中 看 到 的 ， 计 算 功 率 和 风扇 功 率 的 协同 优化 是 
同时 进行 的 ， 基 于 该 目标 的 优化 方法 是 将 风扇 功 耗 优 化 视 为 动态 热管 理 中 
(DIM) 不 可 分 割 的 一 个 重要 组 成 部 分 [521 。 此 外 ， 另 一 种 普通 的 观察 结果 推动 
着 这 种 方法 ， 其 涉及 风扇 转速 定义 、 风 扇 功 耗 、 温 度 和 因 温 度 引 起 的 漏电 功 耗 之 
间 关 系 的 空间 凸 度 。 散 热 器 到 环境 之 间 的 有 效 热 阻 是 在 热管 理 过 程 中 主要 的 调整 
参数 ， 根 据 4. 1 节 中 所 示 的 关系 ， 以 求 在 不 同 的 处 理 器 功率 下 保持 固定 的 温度 梯 
度 。 散 热 器 的 有 效 热 阻 可 以 描述 为 由 风扇 提供 的 空气 流速 和 一 组 物理 参数 组 成 的 
PR, AW PA: 
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通过 替代 空气 流量 与 风扇 功 耗 之 间 的 三 次 方 关 系 ， 有 效 热 阻 可 以 直接 表示 成 
风扇 功 耗 的 函数 。 利 用 该 公式 ， 风 忆 控 制 方法 在 热管 理 过 程 中 通过 PWM 调整 风 
鹿 功 率 ， 同 时 还 可 调节 工作 电压 和 频率 以 实现 总 功 耗 的 最 小 化 。 

除了 大 量 关于 在 一 定 热 边界 条 件 下 控制 冷却 风 遍 转速 以 进行 功 耗 优 化 的 学 术 
研究 之 外 ， 商 业 化 产品 还 对 风扇 进行 动态 管理 。 商 业 产品 中 使 用 的 控制 管理 方法 
作为 DTM 方案 的 一 部 分 在 第 3 章 中 使 用 必 片 集成 温度 传感器 反馈 进行 了 讨论 。 
这 些 控制 管理 方法 主要 是 通过 热 应 急 响 应 ， 将 风扇 转速 提高 到 最 大 速度 ， 直 到 处 
理 器 内 核 上 报 的 结 温 降 到 安全 净值 以 下 为 止 。 它 是 通过 动态 电压 和 频率 大 小 缩放 
的 协调 方式 来 实现 的 。 一 旦 上 报 的 结 温 低 于 安全 极限 ， 风 扁 转速 将 降低 ， 从 而 最 
大 限度 地 降低 风扇 功 耗 和 噪声 。 关 于 将 风 鹿 转速 作为 商业 处 理 器 中 的 DTM 机 制 
的 一 部 分 进行 管理 的 更 多 细节 ， 我 们 建议 读者 查阅 参考 第 3 章 中 的 内 容 。 

最 后 ， 还 有 一 些 调 查 研究 ， 是 关于 主板 和 服务 器 系统 以 外 其 他 组 件 的 强迫 空 
气 冷 却 ， 其 中 一 项 研究 关于 在 便携 式 系统 中 对 电池 组 件 的 强迫 空气 冷却 [3j。 这 
项 研究 的 主要 动机 在 于 观察 连续 循环 充电 和 放电 的 过 程 中 电池 温度 的 急剧 变化 。 
这 种 情况 一 个 有 趣 的 方面 是 ， 用 于 冷却 电池 风扇 的 电源 由 同一 个 系统 电池 提供 。 
当 风 扇 运 行 时 ， 它 将 影响 电池 的 充电 上 容量。 同时， 风扇 有 助 于 降低 电池 温度 ， 从 
而 提高 其 使 用 寿命 ， 这 需要 一 种 仔细 研究 的 折 中 方案 。 在 分 级 框架 内 采用 基于 强 
化 学 习 技术 ， 对 于 一 定 水 平 的 冷却 需求 ， 首 先 确 定 电池 健康 状况 的 改善 。 对 于 较 
高 水 平 的 需求 ， 在 电池 的 使 用 寿命 内 ， 采 用 基于 动态 编程 的 算法 来 确定 冷却 需求 
级 别 〈 比 如 ， 确 定 风 扇 是 否 应 该 关闭 ， 或 者 是 否 应 该 打开 ， 在 哪个 设 定 的 转速 
运行 ) 和 工作 量 之 间 的 最 佳 平衡 点 。 电 池 的 寿命 可 以 认为 是 电池 的 可 靠 性 下 降 
到 其 初始 健康 度 80% 的 时 间 点 。 


4.1.2 基于 风扇 之 外 的 强迫 空气 冷却 系统 
虽然 在 实际 应 用 过 程 中 ， 冷 却 风扇 以 及 和 散热 器 集成 在 一 起 的 冲击 式 冷 却 器 
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被 广泛 用 于 产品 设计 中 ， 但 是 还 有 其 他 一 些 正 处 于 开发 中 的 技术 也 引起 了 大 家 的 
注意 ， 它 们 目前 仍 处 于 原型 和 评估 阶段 。 其 中 一 个 例子 是 由 美国 桑 迪 亚 国家 实验 
室 开发 的 空气 轴承 散热 器 (也 称 为 桑 迪 亚 冷却 器 )[24] 。 本 质 上 ， 这 种 设计 理念 
是 将 散热 器 和 风扇 的 概念 合并 到 同一 个 结构 中 。 铝 散热 翅 片 做 成 旋转 型 叶片 x 
挂 在 热管 基底 上 方 非常 薄 的 空气 屋 上 ( 约 0.03mm) ， 位 于 中 心 位 置 的 无 刷 电动 
机 推动 叶片 运行 。 

微型 喷气 技术 (也 被 称 为 射流 冲击 ) 也 已 被 研究 用 于 微 电 子 冷却 -31。 
这 种 冷却 技术 被 发 现 已 经 在 大 热流 密度 系统 中 得 到 实际 应 用 ， 例 如 制造 工业 中 的 
一 些 设备 、 激 光 器 和 发 光 二 极 管 。 该 技术 的 早期 设计 方案 通过 使 用 瞄准 热 表 面 的 
微型 腔 体 喷 射 射流 的 泵 来 产生 冲击 射流 。 最 近 的 技术 方法 主要 是 关于 创建 “ 合 
成 射流 ”530-3]。“ 合 成 射流 ”通过 由 空气 腔 组 成 的 一 个 射流 装置 产生 ， 该 空气 
腔 由 项 侧 的 柔性 膜 和 底 侧 的 指向 发 热 表 面 的 孔 口 组 成 [5] 。 与 利用 专用 管道 或 通 
道 输送 气流 的 传统 方式 不 同 ， 该 装置 直接 放置 在 流体 中 。 膜 的 振动 将 空气 吸入 空 
腔 中 ， 然 后 通过 喷嘴 将 气流 喷射 出 去 。 在 喷射 过 程 中 ， 夹 带 的 空气 形成 涡流 环 ， 
其 以 “合成 射流 ”的 形式 排出 周围 的 流体 。 膜 的 振动 可 以 通过 将 磁体 放置 在 柔 
性 膜 上 并 将 AC 电流 施加 到 放置 在 膜 背 面 的 线圈 以 产生 的 交 变 磁场 来 产生 。 最 近 
的 研究 主要 集中 在 模拟 这 些 装 置 ， 并 得 出 “合成 射流 ”冷却 散热 器 的 有 效 热 阻 ， 
以 及 装置 参数 (如 喷 孔 的 形状 ， 激 发 频率 ) 的 灵敏 度 研究 。 该 装置 的 简单 说 明 
如 图 4.3 所 示 。 


空气 排 山 过 程 中 
VE GR 


图 4.3 用 于 产生 “合成 射流 ”冷却 的 腔 体 装置 示意 图 


压 电 风扇 是 一 种 非常 有 应 用 前 景 的 无 摩擦 运动 部 件 的 冷却 技术 ， 其 悬臂 叶片 
由 压 电 转换 器 驱动 05 -4] 。 利 用 AC 电压 激励 压 电 材料 (例如 ，PVF,) 会 引起 材 
料 膨 胀 和 收缩 ， 该 弯曲 运动 通过 附 接 在 压 电 材料 顶端 处 的 悬臂 来 放大 ， 产 生 的 气 
流 迅 速 远 离 悬 臂 的 顶端 ， 悬 人 臂 可 以 面向 散热 器 侧 放置 以 推动 气流 通过 散热 锅 。 这 
种 类 型 的 风扇 有 望 成 为 低 噪声 和 低 功率 的 冷却 部 件 ， 并 应 用 于 实际 产品 ， 但 是 还 
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需要 开展 进一步 的 研究 。 目 前 该 技术 的 一 些 研究 主要 集中 在 一 些 功率 受 限 设备 上 
的 应 用 ， 比 如 笔记 本 电脑 和 移动 电话 ra,4] 。 

无 摩擦 风扇 叶片 的 另 一 个 概念 
结合 了 压 电 风扇 的 悬臂 式 叶片 和 
“合成 射流 ”磁性 原理 的 想 A 
pel 44) 。 其 利用 磁场 驱动 柔性 聚合 


磁性 线圈 


AUN ZEND 
物 材料 或 者 刚性 材料 的 叶片 在 垂直 柔性 叶片 
方向 上 产生 气流 ， 如 图 4.4 所 示 。 
最 后 ， 一 种 非常 有 趣 的 冷却 技 磁性 线 轿 
术 是 利用 电荷 电离 空气 分 子 ， 实 现 图 4.4 用 于 强制 空气 冷却 的 
热量 的 传输 !s$ -4%] 。 这 种 技术 很 像 压 磁场 驱动 无 摩擦 叶片 示意 图 


电 和 磁性 叶片 ， 特 别 适用 于 小 尺寸 

设备 ， 如 笔记 本 电脑 和 移动 设备 。 该 冷却 技术 利用 两 个 电极 来 产生 电场 ， 在 电离 
的 空气 中 ， 朝 向 正极 移动 的 电子 击 中 空气 中 氧 和 氮 分 子 的 电子 ， 随 着 离子 向 负极 
移动 ， 由 此 形成 “离子 风 ”。 


4.2 液体 冷却 


芯片 冷却 的 发 展 历程 最 先 开 始 于 被 动 冷却 散热 器 ， 并 逐步 发 展 到 强制 空气 冷 
却 。 如 上 所 述 ， 尽 管 具有 若干 潜在 功 耗 优 势 、 小 尺寸 、 低 噪声 和 高 效率 的 空气 冷 
却 研 究 一 直 处 于 发 展 当 中 ， 但 是 冷却 技术 也 同时 朝 着 其 他 方向 在 发 展 。 在 实际 应 
HF, 已 经 发 现 有 液体 冷却 技术 成 功 地 应 用 于 商业 用 途 。 液 体 冷 却 具 有 很 长 的 发 
展 历史 ， 始 于 IBM 引入 水 冷 技术 用 于 冷却 苹 板 中 的 热量 。 目 前 ， 在 实际 应 用 中 ， 
从 机 架 的 多 层 设备 堆 释 到 单个 蕊 片 ， 液 体 冷 却 用 来 缓解 其 中 的 大 量 热 损 耗 。 该 技 
术 带 来 了 新 的 设计 和 制造 开销 ， 因 为 液体 冷却 系统 涉及 相关 其 他 部 件 (AE. WX 
体 管 道 、 散 热 器 中 的 微 通道 ) 以 形成 液体 循环 ， 并 且 需 要 确保 冷却 液体 的 隔离 。 
对 于 通常 在 高 性 能 计算 中 遇 到 的 具有 极端 热 应 力 的 系统 ， 较 高 的 设计 成 本 是 必需 
的 。 数 据 中 心 和 超级 计算 机 通常 使 用 机 架 级 的 液体 冷却 技术 ， 而 芯片 级 液体 冷却 
的 一 个 突出 案例 是 在 超级 计算 机 中 使 用 的 IBM Blue Gene/Q ith}, EA 18 个 
PowerPC 内 核 ， 在 其 散热 器 中 使 用 了 液体 冷却 技术 。 吸 引 人 们 对 液体 冷却 技术 感 
兴趣 的 另 一 个 领域 是 3D 集成 电路 ， 这 在 多 种 设计 方面 存在 大 量 的 学 术 研 究 。 最 
后 ， 超 频 领 域 的 用 户 也 非常 有 兴趣 利用 液体 冷却 改进 计算 机 的 性 能 [9 ] 。 在 一 台 
Mac Pro 计算 机 上 证 明 ， 增 加 液体 冷却 后 带 来 了 明显 的 温度 余 量 ， 可 将 计算 机 从 
2. 8GHz 超频 到 3. 16GHzl501 , 

无 论 规模 大 小 ， 液 体 冷却 系统 主要 具有 两 个 重要 组 成 部 分 。 第 一 个 组 成 部 分 
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是 由 用 于 液体 循环 的 泵 和 与 冷 板 (散热 右 ) 集成 在 一 起 的 管道 构成 ， 该 冷 板 用 
以 承载 流体 并 且 使 得 能 够 从 与 它 接触 的 热 表面 带 走 热量 。 第 二 个 组 成 部 分 是 热 交 
换 器 ， 其 位 于 冷却 系统 的 远 端 ,通过 含有 液体 的 管道 与 冷 板 (散热 器 ) 相连 接 。 
热 交 换 器 接收 热流 体 ， 流 体 中 的 热量 通过 系统 风扇 向 交换 器 中 吹 送 冷 空气 后 被 冷 
却 。 一 旦 液体 中 的 热量 被 释放 到 环境 中 后 ,液体 温度 降低 ， 并 可 以 通过 泵 的 驱动 
再 次 循环 利用 。 图 4. 5 描述 了 冷 板 散 热 右 中 骨 入 微 通道 的 单 相 液 体 冷 却 系 统 的 主 
要 组 成 部 件 。 在 该 图 中 ， 描 述 出 了 用 于 IC 芯片 冷却 的 液体 冷却 系统 。 系 统 的 主 
要 部 件 包 括 具有 液体 冷却 剂 的 闭环 循环 系统 、 驱 动 液体 冷却 剂 的 宵 、 刻 有 微 通道 
的 冷 板 散 热 器 、 由 风扇 冷 却 散热 需 组 成 的 热 交 换 器 。 在 数据 中 心 和 超级 计算 机 中 
部 署 的 液体 冷却 系统 在 宏观 尺度 上 遵循 相同 的 基本 原理 。 在 这 些 大 型 系统 中 ， 热 
交换 器 通常 不 是 用 风扇 冷却 。 相 反 ， 这 些 热 交换 器 一 般 为 液 - 液 交 换 器 。 从 计算 
机 系统 流出 的 被 加 热 过 的 冷却 剂 液体 通过 制冷 装置 被 冷却 。 虽 然 这 些 制 冷 装置 为 
高 性 能 计算 系统 的 工作 温度 提供 了 更 加 严格 的 保证 ， 但 它 导 致 了 用 于 计算 机 冷却 
的 能 源 账单 的 另 一 项 成 本 开销 。 针 对 这 一 点 ， 已 经 提出 了 不 含 制冷 装 置 的 数据 中 
心 架 构 ， 其 仅 利用 外 界 空气 的 温度 来 冷却 具有 较 高 温度 的 冷却 剂 液体 学] 。 此 
外 ， 近 年 来 已 经 建设 部 署 了 使 用 高 温 冷 却 剂 液体 的 数据 中 心 13,31。 


图 4.5 ” 微 通道 液体 冷却 系统 ， 利 用 系统 远 端 的 换 热 器 冷却 微 芯片 


应 用 于 芯片 级 的 液体 冷却 涉及 冷 板 散 热 器 内 的 微 通道 〈 微 型 凹 槽 ) o VQ EN 
液体 (通常 为 水 ) 通过 冷 板 散热 器 的 热 表面 ， 横 向 循环 流 过 这 些微 通道 。 早 期 
刻 有 微 通道 的 散热 器 建议 将 液体 冷却 热 交换 器 技术 缩小 到 微 太 度 ， 使 其 可 以 应 用 
于 IC AN Aa ADS! 。 从 那 时 起 ， 大 量 的 研究 工作 集中 在 设计 和 制造 纳米 尺寸 的 
微 通道 155.71， 替代 用 冷却 剂 液体 '%,”] ， 微 通道 和 液体 泵 与 芯片 封装 沉 体 的 集 
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ACER ARO) ， 基 于 最 佳 流量 和 压力 的 液体 泵 的 控制 管理 ， 以 及 在 冷却 剂 液体 行进 
穿 过 冷 板 散 热 器 之 后 收集 冷却 剂 液 体 的 热 交换 器 的 设计 [1 -55]。 

微 通道 液体 冷却 系统 可 以 大 致 分 为 单 相 系统 和 多 相 系统 。 在 整个 冷却 过 程 
中 ， 单 相 系统 的 冷却 剂 液体 始终 保持 为 液体 状态 ， 而 多 相 冷 却 系统 中 人 允许 冷却 剂 
从 液体 状态 转变 成 蒸气 ， 反 之 亦 然 。 冷 却 剂 液体 在 通道 内 的 流动 也 可 以 大 致 分 为 
两 种 类 型 : 层 流 和 汕 流 。 层 流 是 在 稳定 状态 下 流 过 通道 的 液体 有 组 织 的 运动 ， 这 
就 造成 均匀 的 液体 分 子 层 沿 着 它们 各 自 的 层 以 固定 的 速度 移动 。 满 流 则 破坏 了 这 
种 均匀 性 ， 造 成 层 与 层 的 分 离 ， 并 且 液 体 分 子 不 再 保留 在 沿 流动 路 径 的 单一 层 
内 ， 在 流动 过 程 中 不 断 改 变 流 动 速度 ， 改 变 流 动 的 分 布 与 位 置 。 通 过 通道 壁面 的 
辐射 和 对 流 换 热 以 及 通过 壁 表面 到 内 部 流体 的 热传导 ， 热 量 从 热源 BH) 
传递 到 通道 内 的 液体 。 冷 却 效 率 可 以 通过 有 效 热 阻 (或 热 传 递 系数 ) 来 衡量 ， 
就 像 强制 空气 冷却 系统 一 样 。 换 热 计算 可 以 通过 下 面 的 控制 方程 得 到 .; 

Q = UAAT (4. 13) 
式 中 ，0 表示 热 交 换 量 ; U 表示 换 热 系数 ; 4 表示 表面 积 AT 表示 进出 口 液体 
的 温度 差 。 通 道 与 冷却 剂 液体 之 间 的 对 流 换 热 也 可 以 用 无 量 纲 努 塞 尔 特 数 来 表 
示 。 其 表示 为 对 流 换 热 与 导热 的 比值 : 


Nu 


-hD 

k 
式 中 , h 表示 对 流 换 热 系数 ; D 表示 通道 的 特征 尺寸 ( 比如， 圆 形 通 道 的 直径 ); 
k 表示 液体 的 导热 系数 。 对 于 通道 内 流体 的 层 流 流动 ， 努 塞 尔 特 数 为 一 个 恒定 的 
常数 ， 从 而 得 出 换 热 系数 与 通道 的 特征 尺寸 成 反比 关系 。 

用 于 定义 液体 冷却 系统 的 另 一 个 无 量 纲 参数 是 雷诺 数 Re， 其 有 助 于 定义 流 
体 的 流动 类 型 。 层 流 的 雷诺 数 较 低 ， 消 流 的 雷诺 数 较 高 。 该 参数 可 以 用 于 表征 微 
通道 内 的 压力 降 。 

还 有 两 个 无 量 纲 数 可 以 用 于 描述 流体 的 换 热机 制 ，(D 瑞 利 数 Re ， 表 示 流 体 
的 浮力 、 流 体 黏 度 ， 以 及 流体 热 扩 散 率 之 间 的 关系 ; QDR Pr， 描 述 了 流 
体 的 动力 学 特性 与 热 扩 散 率 之 间 的 关系 。 

努 塞 尔 特 数 也 可 以 表示 成 瑞 利 数 Ra 和 普 朗 特 数 Pr 的 函数 '%] ， 即 


2 


(4. 14) 


0. 387 Ra* 


Seal 

液体 冷却 技术 的 男 一 个 重要 指标 是 微 通道 内 的 液体 压力 。 沿 冷却 路 径 的 压力 
降 特 别 重要 ， 因 为 它 取决 于 微 通道 的 换 热 效率 的 平衡 ， 热 量 的 冷却 与 流体 的 质量 
流 率 相关 。 男 一 方面 ， 随 着 质量 流 率 的 增加 ， 流 道 的 沿 程 压 降 将 会 降低 。 要 人 么 需 
要 利用 额外 的 和 泵 功 耗 来 弥补 增加 的 压力 损失 ， 或 者 承受 效率 的 降低 。 通 常用 每 单 


0. 825 + 


Nu = (4. 15) 
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位 长 度 的 压力 降 来 描述 冷却 系统 的 压力 特性 ， 即 
APO 
L 2D 
AF, AP 表示 液体 流 道 的 压力 降 ; L 表示 流 道 的 长 度 ; 了 表示 流体 的 体积 通 量 ; 
/表示 摩擦 系数 ，D 表示 流 道 的 特征 尺寸 ; p 表示 流体 的 密度 ; f 称 为 范 宁 因 子 ， 
其 表示 壁面 前 切 应 力 与 每 单位 体积 动能 的 比值 [$1 。 对 于 给 定 几 何 形状 通道 内 的 
层 流 流动 ， 范 宁 因 子 与 雷诺 数 的 乘积 是 一 个 常数 ， 而 且 在 消 流 流动 中 ， 这 两 个 参 
数 ( 范 宁 因 子 和 雷诺 数 ) 也 遵循 一 定 的 关系 。 
基于 上 面 令 述 的 热 传 递 关 系 ， 几 何 参 数 、 材 料 属 性 、 芯 片 的 冷却 要 求 ， 以 及 
用 于 冷却 的 芯片 热 功 耗 ， 所 有 因素 决定 了 系统 内 流体 的 流动 类 型 以 及 液体 冷却 系 
统 的 冷却 效率 ， 这 些 参 数 可 以 根据 冷却 系统 的 成 本 效益 进行 优化 。 在 接 下 来 的 章 
节 中 ， 我 们 将 对 这 些 参数 进行 讨论 。 


4.2.1 液体 冷却 系统 的 效率 和 成 本 优化 


微 通道 几何 形状 : 微 通 道 结构 的 尺寸 和 位 置 设计 与 冷却 效率 有 着 直接 的 关 
系 。 通 道 可 以 是 圆 形 的 ， 也 可 以 是 非 圆 形 的 。 对 于 非 圆 形 (例如 ， 长 方形 ) 通 
道 ， 定 义 了 其 特征 尺寸 ， 其 中 横 截 面 较 短 边 可 以 被 认定 是 几何 形状 的 特征 尺寸 。 
特别 地 ， 随 着 通道 的 几何 尺寸 进入 纳米 量 级 ， 对 于 层 流 流动 ， 因 为 努 塞 尔 特 数 是 
一 个 恒定 的 常数 ， 这 表明 对 流 换 热 系数 将 会 增加 几 个 数量 级 。 另 一 方面 ， 极 小 的 
通道 尺寸 加 剧 了 流体 的 压力 降 ， 并 且 可 用 于 热传导 的 表面 积 也 会 变 得 更 少 。 因 
此 ， 为 了 达到 一 定量 的 液体 流量 ,需要 补偿 因 通 道 几何 尺寸 减 小 引起 的 压力 降 。 

可 以 围绕 设计 空间 的 多 个 维度 来 追求 设计 的 平衡 点 。 例 如 ， 有 一 项 研究 比较 
了 用 于 处 理 器 芯片 冷却 的 两 种 类 型 的 冷 板 散热 器 : 一 个 是 性 能 相对 较 高 ， 成 本 也 
较 高 的 铜 造 冷 板 ， 其 内 部 结构 加 工 成 沟 模 的 形式 ; 另 一 个 是 性 能 相对 较 低 ， 成 本 
也 较 低 的 冷 板 ， 其 结构 为 铜 管 镶嵌 在 铝 块 之 中 [9 。 这 里 考虑 的 所 有 冷 板 散热 器 
的 内 部 通道 均 为 矩形 通道 ， 冷 却 介 质 均 为 水 。 人 研究 中 分 析 了 两 种 不 同类 型 的 冷 板 
散热 融 内 通道 的 不 同 宽度 ， 加 工 的 微 通道 可 以 在 较 低 的 流速 下 实现 较 高 的 热 交 
换 ， 尽管 需 要 经 受 较 大 的 压 降 。 成 本 较 低廉 的 褒 入 铜 管 式 铝 冷 板 散 热带 需要 更 大 
的 流量 ， 其 经 受 的 压力 降 也 较 小 。 

除了 通道 的 几何 尺寸 ， 设 计 冷 板 散热 器 时 可 以 改变 流体 的 流动 方向 和 通道 的 
密度 。 多 个 通道 可 以 在 冷 板 进出 口 之 间 以 单个 流 道 的 形式 平行 排 布 ， 冷 板 的 每 单 
位 面积 平行 通道 的 数量 可 以 是 方案 设计 的 一 个 参数 变量 。 通 道 的 宽度 和 冷 板 的 总 
表面 积 以 及 可 接受 的 设计 复杂 度 共同 决定 了 可 行 的 通道 密度 。 为 外 一 种 方案 是 使 
用 具有 多 个 串联 的 分 段 通道 来 创建 蛇 形 布局 的 通道 ， 每 段 通道 也 可 以 包含 多 个 平 
行 的 通道 。 这 些 通道 的 布局 设计 如 图 4.6 所 示 。 


(4. 16) 
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图 4.6 液体 冷却 通道 的 可 选 方案 
a) 平行 通道 结构 b) 蛇 形 结构 


微 通道 结构 的 宽度 与 深度 比值 以 及 怒 片 宽度 (分割 各 个 微 通道 边界 的 宽度 ) 
与 深度 的 比值 可 以 作为 设计 变量 进行 优化 。 其 中 一 项 研究 在 总 泵 功率 一 定 的 条 件 
下 ， 对 该 问题 进行 了 详细 阐述 :M1。 以 冷 板 散 热 器 的 有 效 热 阻 为 目标 函数 ， 对 该 
函数 进行 求 最 小 值 处 理 。 研 究 中 ， 液 体 的 平均 流速 表示 成 泵 功率 、 微 通道 几何 特 
征 、 雷 诺 数 、 范 宁 摩擦 系数 和 物理 系数 的 函数 。 同 时 ， 泵 功率 还 受 限于 目前 泵 技 
术 的 发 展 ， 其 功率 范围 在 0.01 ~0.8W 之 间 ， 进 而 通过 比较 计算 所 得 到 的 流速 值 
以 满足 泵 功率 范围 来 探究 确定 微 通 道 尺寸 变量 的 范围 。 宽 度 与 深度 之 比 ( 微 通 
道 宽度 与 深度 的 比值 ， 以 及 怒 片 宽度 与 深度 的 比值 ) 的 范围 分 别 为 0.1 ~0.25 和 
0.04 ~1.0。 根 据 研究 得 到 的 一 个 重要 结论 是 ， 围 绕 着 最 优 设计 ， 冷 板 散 热 器 热 
阻 对 微 通道 宽度 与 深度 之 比 的 敏感 性 相 较 于 对 翅 片 宽度 与 深度 之 比 更 加 敏感 。 在 
设计 过 程 中 ， 微 通道 也 可 以 考虑 除了 圆 形 和 和 抑 形 之 外 的 其 他 横 截 面 形 状 的 设计 。 
一 项 研究 调查 了 通过 化 学 蚀刻 形成 的 具有 侧 壁 角 的 梯形 通道 ;7 。 另 一 种 用 于 定 
制 微 通道 几何 形状 以 改善 热 传 递 的 方法 是 微 通道 宽度 调制 [*]。 从 微 通道 宽度 和 
努 塞 尔 特 数 之 间 的 反比 关系 开始 ， 通 过 将 侧 壁 表面 的 换 热 系数 投射 换算 成 垂直 表 
面 的 换 热 系数 ， 得 到 芯片 上 冷 板 散热 器 的 有 效 换 热 系数 ， 计 算 关 系 如 式 (4.17) 
所 示 。 式 中 包含 了 微 遂 道 的 高 度 (He) 和 宽度 〈 了 到 )， 以 及 通道 的 总 宽度 
(QW), ， 还 包含 了 通道 周围 怒 片 的 宽度 。 
yet =n te (4.17) 
通过 允许 根据 微 通道 的 长 度 定制 设计 非 均匀 宽度 的 通道 结构 ， 便 可 以 调节 冷 
却 结 构 的 有 效 对 流 热 阻 。 当 通道 宽度 朝 着 流体 出 口 方向 逐渐 收缩 变 小 时 ， 沿 着 流 
体 流 动 方向 上 通道 内 流体 所 增加 的 温度 梯度 可 以 通过 提高 的 对 流 换 热 得 到 补偿 。 
从 沿 着 通道 方向 压力 不 均匀 分 布 的 角度 考虑 ， 我 们 研究 了 多 通道 并 联 和 串联 
结构 的 压力 情况 。 较 长 平行 通道 的 一 个 缺点 可 能 是 流 道 出 入口 两 端 之 间 的 压力 变 
化 将 会 非常 陡峭 。 研 究 人 员 已 经 提出 了 HY 型 结构 的 流 道 布 局 来 削弱 这 个 问题 ， 
其 中 平行 流 道 部 分 在 类 似 梯形 结构 的 中 间 点 处 交叉 汇合 !231 。 
设计 的 另 一 个 方向 是 微 通道 的 堆 琶 ， 如 图 4.7 所 示 。 通 过 增加 第 二 层 微 通道 
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结构 ， 可 以 将 单 层 平行 通道 结构 的 热 
阻 降低 30% 7) 。 对 这 种 结构 的 优化 
设计 ， 主 要 集中 在 微 通 槽 的 宽度 、 翅 
宽度 以 及 长 宽 比 〈 通 道 长 度 与 宽度 
的 比值 ) 这 几 个 参数 上 ”1。 
微 通道 的 设计 有 两 种 方式 : 一 种 
是 通道 的 内 表面 是 光滑 设计 ; 另 一 种 
设计 是 通道 的 内 表面 增加 沟 槽 ， 以 增 
加 表面 积 。 使 用 槽 道 深度 与 高 度 之 AR 
Hb, SETAE RET EE. REB EAT SR NY AR 
与 间距 之 比 ， 以 及 槽 道 宽度 与 高 度 之 
比 作为 设计 变量 '”] 。 在 各 设计 参数 选项 中 产生 了 一 个 “ 帕 雷 托 最 优 前 沿 ”， 并 
且 发 现 沟 槽 间距 与 高 度 的 比值 是 帕 雷 托 分 析 法 最 敏感 的 参数 。 当 发 现 槽 道 宽 度 与 
深度 的 比值 对 于 光滑 通道 表面 的 热 阻 产生 的 影响 最 大 时 !") ， 覃 道 便 作为 一 个 新 
的 显著 有 效 的 变量 被 引入 到 设计 中 。 最 近 的 一 项 研究 调查 了 HY 型 几何 结构 通道 
沿 整个 通道 长 度 的 特性 ， 通 道内 部 综合 了 槽 道 结 构 和 光滑 结构 !”] 。 同 时 还 研究 
了 其 他 几何 形状 ， 例 如 了 T 形 翅 片 ， 置 于 通道 内 的 柱 结构 以 及 交错 翅 片 '” 。 
流量 与 微型 泵 设计 : 满足 冷却 要 求 条 件 下 调节 液体 流量 和 减 小 沿 微 通道 的 液 
体 压 降 是 流量 管理 的 两 个 主要 问题 。 在 冷却 热量 0 条 件 下 ， 为 了 维持 固定 的 进 
出 口 温度 差 ， 所 需要 的 液体 质量 流量 表示 如 下 : 


bs Q 
HERUM Sm (4. 18) 


式 中 ，c, 表 示 液 体 的 比热容 。 随 着 设备 热 功 耗 的 增加 ,冷却 系统 中 需要 的 液体 质 
量 流量 也 更 多 。 这 个 冷却 系统 的 管理 挑 成 就 类 似 于 处 理 需 在 一 定 热 负载 下 的 动态 
性 能 调节 ， 随 着 温度 的 升 高 ， 处 理 器 的 性 能 将 会 降低 ， 而 在 液体 冷却 条 件 下 ， 液 
体 流 量 必须 变 大 。 一 种 设计 的 方法 就 是 确定 最 坏 冷 却 条 件 下 需要 的 液体 流量 ， 这 
自然 会 导致 泵 消耗 的 功 耗 最 大 。 基 于 此 ,已 经 提出 了 一 种 可 变 流 量 的 控制 
逻辑 1”]。 

此 外 ， 除 了 管理 冷却 系统 的 液体 流量 ， 研 究 设计 用 于 冷 板 散热 器 的 微型 泵 也 
是 一 个 活跃 的 研究 领域 。 对 于 从 机 械 旋转 泵 到 电磁 隔膜 肝 、 压 电 致 动 咒 、 形 状 记 
忆 合金 致 动 、 静 电 致 动 、 Pe) De AUTH, BS ee ok FT, TE CE A 
方法 180,81] 


4.2.2 3D 集成 电路 芯片 的 液体 冷却 
随 着 垂直 集成 技术 的 到 来 ， 一 个 新 的 3D 集成 电路 芯片 产业 出 现 了 ， 它 需要 
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更 苛刻 的 冷却 需求 和 独特 的 热 挑战 。 最 近 大 多 数 液体 冷却 的 研究 都 以 3D 集成 电 
路 芯片 为 中 心 。 因 此 ,在 这 里 对 3D 集成 电路 芯片 的 液体 冷却 应 用 进行 单独 的 讨 
论 。 这 个 课题 的 早期 研究 主要 是 关于 多 芯片 模 组 的 液体 冷却 应 用 [ 旦 加 ] ， 最 近 的 
调查 研究 已 经 引入 了 创新 型 的 、 优 化 的 多 层 堆 针 集成 电路 芯片 冷却 技术 。 

其 中 早期 研究 之 一 利用 了 计算 流体 力学 (Computational Fluid Dynamics， 
CFD) 分 析 方 法 来 评估 3D 堆 秋 集 成 电路 芯片 的 热 行为 ， 并 设计 了 一 个 最 佳 的 热 
电 HY 型 液体 冷却 系统 MI。 这 个 液体 冷却 系统 使 用 了 一 个 水 冷 散 热 器 ， 该 水 冷 
散热 絮 采 用 单 通道 结构 ， 通 道 的 入 口 较 宽 ， 并 附 接 在 热电 制冷 器 (TEC) 的 发 热 
面 一 侧 。 通 道内 的 液体 处 于 灌流 状态 ， 在 入 口 处 液体 保持 恒定 的 质量 流量 ， 在 出 
口 处 保持 恒定 的 压力 。 该 研究 创建 了 一 个 4 层 堆 赤 芯片 的 CFD BERI, TAXES S 
片 的 CFD 模型 使 用 虚拟 的 热源 ， 同 时 具有 HY 型 结构 的 冷却 系统 ， 并 且 对 CFD 
模型 的 分 析 计 算 结 果 与 实验 系统 实际 测试 所 得 的 结果 进行 了 对 比 验证 。 

另 一 个 模型 的 研究 旨 在 更 好 地 了 解 液体 冷却 与 3D 集成 电路 芯片 之 间 热 量 的 
相互 作用 ， 并 评估 了 因为 液体 冷却 技术 而 为 3D 集成 电路 芯片 带 来 的 峰值 性 
能 5 。 该 项 研究 成 功 验证 了 液体 冷却 技术 应 用 于 3D 集成 电路 芯片 ， 同 时 液 冷 
散热 器 应 对 的 热流 密度 高 达 135 W/em^ 。 该 项 研究 模拟 创建 了 一 个 完全 集成 一 体 
的 散热 带 ， 散 热 絮 液体 通道 般 入 在 堆栈 中 的 层 与 层 之 间 ， 这 种 散热 右 的 集成 一 体 
化 引入 了 一 个 新 参数 用 于 散热 器 的 设计 优化 。 例 如 ， 在 多 通道 散热 器 中 ,不 同 层 
通道 中 的 液体 速度 和 压力 不 需要 相同 。 事 实 上 ， 不 同 地 方 的 散热 需求 将 决定 不 同 
的 冷却 解决 方案 。 此 外 ， 虽 然 在 每 个 通道 的 内 部 ， 不 同 的 力 都 在 发 挥 作用 ， 但 是 
如 果 冷 却 系统 被 构建 成 共用 同一 个 进口 歧 管 和 出 口 玻 管 ， 并 共用 同一 个 和 泵 ， 它 们 
将 会 彼此 干扰 。 另 一 个 方法 是 为 每 层 的 通道 部 署 专用 的 动力 源 。 这 项 研究 重点 突 
出 了 这 些 蔡 代 方 案 在 建 模 方 面 的 挑战 ， 并 且 为 整个 冷却 系统 创建 可 行 的 计算 热 模 
型 所 需要 的 条 件 假设 进行 了 简化 处 理 。 该 研究 已 经 分 别 为 单 相 和 双 相 冷却 系统 开 
发 创建 了 热 分 析 模 型 ， 且 该 模型 通过 推导 热 传 递 方程 而 得 出 ， 同 时 考虑 了 通道 的 
几何 形状 、 流 体 的 物性 ， 以 及 集成 电路 芯片 的 发 热源 。 

因为 考虑 到 详细 CFD 计算 模型 的 复杂 度 ， 建 立 了 一 个 符合 多 层 堆 麦 芯片 的 
模型 ， 堆 释 模 型 每 层 采用 独立 的 微 通 道 ， 每 个 微 通道 具有 一 对 进出 口 !] 。 为 
了 合理 处 理 堆 释 模型 的 复杂 性 ， 把 整个 冷却 散热 带 看 成 一 个 多 孔 介 质 材料 。 代 表 
微 通道 的 换 热 系数 和 流体 动力 学 阻力 的 模型 参数 通过 对 微 通道 小 区 域内 详细 3D 
CFD 模拟 的 结果 进行 平均 而 得 到 。 在 涉及 选择 具有 局 部 热 不 平衡 和 正 交 各 向 异 
性 热传导 以 及 流体 动力 学 阻力 的 各 向 同性 多 孔 介 质 模 型 的 建 模 优化 时 ， 堆 铸模 型 
的 计算 分 析 结 果 和 实际 测试 数据 对 比 的 精度 在 1096 以 内 。 

随 着 在 3D 集成 电路 芯片 中 使 用 集成 液体 冷却 架构 思想 的 进步 和 发 展 ， 出 现 
了 对 精确 热 仿真 工具 的 需求 。3D - ICE 工具 是 用 于 快速 模拟 液体 冷却 系统 的 工具 
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之 一 (1。 即 便 尽量 使 CFD 模型 的 复杂 度 降 到 最 低 ， 以 便 这 种 强大 的 建 模 技术 更 
加 实用 ， 但 是 对 瞬 态 热 模拟 计算 速度 的 要 求 通常 需要 得 到 几 个 数量 级 的 提升 。 
3D -ICE 工具 提供 了 这 种 性 能 优势 (与 普通 CFD 模拟 计算 方法 相 比 ， 速 度 提高 
了 约 975 倍 ) ， 并 已 经 为 热电 池 和 微 通道 创建 了 等 效 的 简化 热 模型 。 在 一 个 3D 
集成 电路 芯片 上 的 测试 发 现 ， 仿 真 计算 结果 与 实际 测试 数据 相差 1. SK 以 内 。 
还 需要 注意 到 ， 技 术 工艺 和 制造 步骤 的 发 展 将 微 通道 有 效 地 集成 到 3D 集成 
电路 内 [8%] ， 本 研究 中 描述 的 技术 工艺 主要 展示 了 光 刻 工艺 过 程 ， 在 微 通道 和 流 
体 硅 通 孔 技术 之 后 ， 出 现 了 电气 OR 
性 硅 通 孔 技术 制造 加 工 工艺 。 该 
研究 还 设想 了 一 种 与 3D 集成 电 
路 集成 在 一 起 的 微 通道 网 络 结构 ， 
集成 式微 通道 的 每 一 独立 层 在 结 
构 上 与 前 文 表述 的 一 样 ， 并 且 通 
过 流体 硅 通 孔 以 及 水 平方 向 微 通 
道 与 垂直 硅 通 孔 连接 的 管道 ， 把 
A eae 图 4 8 ”利用 流体 硅 通 孔 TSV 技术 把 微 通道 集成 到 3D 
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通道 入口 与 流 体 硅 通 孔 TSV 连接 互通 ， 它 们 也 可 以 
= abu Y s B 
HEB a, ESMOR IE 。 通过 世 片 的 基底 从 堆 番 结构 的 底部 与 硅 通 孔 连接 


芯片 发 热 核心 和 流体 硅 通 孔 结构 ， a6 
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考虑 到 重负 载 芯片 中 非常 剧烈 的 热 应 力 ， 在 堆 基 结构 的 集成 电路 中 创建 流体 
通道 网 路 需要 一 定 的 创新 性 。 本 书 介绍 了 流体 互联 结构 优化 的 设计 参考 方法 ， 以 
减 小 沿 流体 管 路 的 压力 降 [s] 。 设 计 问题 中 主要 涉及 流 道 进口 、 出 口 ， 以 及 泵 体 
小 型 化 的 能 力 ， 以 保持 所 和 希望 的 液体 流量 和 压力 ， 特 别 是 在 跨越 多 个 特征 尺度 的 
交界 面 处 。 这 些 问题 可 以 认为 类 似 于 设计 芯片 的 IO0 信号 ， 但 在 驱动 强度 、 接 品 
和 兼容 性 方面 出 现 挑战 。 在 考虑 大 小 尺寸 因素 时 ， 为 了 实现 压力 降 最 小 ， 液 体 进 
出 端口 的 类 型 以 及 接口 连接 器 均 需 要 优化 设计 。 

基于 大 规模 的 生产 制造 考虑 ， 研 究 低 成 本 的 流体 网 路 组 装 技术 对 于 这 种 液体 
冷却 技术 的 推广 普及 显得 十 分 重要 。 另 一 项 研究 就 集中 在 这 个 方面 ， 该 研究 提出 
了 晶 圆 级 的 有 效 集成 方法 ， 通 过 电气 性 硅 通 孔 和 流体 硅 通 孔 相互 连接 到 一 个 独立 
的 芯片 中 ， 便 很 容易 地 组 合 构建 成 多 层 结构 [91 。 通 过 晶 圆 流体 硅 通 孔 和 聚合 物 
管用 来 构造 微 通道 ， 这 些微 通道 同时 和 芯片 的 供电 线路 以 及 信号 线路 集成 装配 在 
一 起 。 这 里 描述 了 三 种 可 选 的 流体 1/0 技术， 其 中 包括 聚合 物 管 、 焊 接管 ， 以 及 
SAPR C4 VO 技术 。 焊 接管 相对 于 聚合 物 管 的 优点 在 于 密封 焊接 管 相对 简单 ， 


dau TTEQ- 


可 直接 与 芯片 基底 上 的 铜 圈 连 接 ， 而 不 需要 任何 额外 的 中 间 密 封 材料 。 这 使 得 堆 
肥 芯 片 结构 中 层 与 层 之 间 所 需要 的 空间 最 小 ， 这 就 允许 结构 更 加 紧凑 。 更 重要 的 
是 ， 与 聚合 物 管 不 同 ， 在 相同 的 工艺 过 程 中 ， 比 如 在 电气 互 连 过 程 中 可 以 同时 进 
行 流 体 VO 的 焊接 作业 ， 这 样 就 降低 了 制造 加 工 的 成 本 。 

早期 主要 是 关注 建 模 和 制造 方面 的 研究 工作 ， 随 后 是 在 特定 计算 领域 关于 运 
用 新 兴 液 体 冷却 技术 的 研究 。 在 诸多 研究 中 ， 高 性 能 处 理 器 芯片 首先 得 到 了 人 们 
的 评估 和 研究 。 在 3D 多 核 处 理 器 芯片 上 对 强迫 空气 冷却 和 液体 冷却 的 一 项 比较 
中 发 现 ， 应 用 液体 冷却 技术 后 芯片 的 最 高 温度 降低 了 45% ， 漏 电 功 耗 降 低 了 
12. 8% 91, 5p 4. 8 所 描述 的 液体 冷却 系统 类 似 ， 该 系统 研究 通过 相似 的 方式 
进行 建 模 ， 在 堆 释 的 层 与 层 之 间 具 有 集成 的 液体 通道 。 液 体 冷 却 对 各 种 可 靠 性 指 
标 ( 电 迁移 、 应 力 迁 移 、 时 间 依 赖 的 介质 击 穿 、 负 偏 压 温度 不 稳定 性 和 热 循环 ) 
的 积极 影响 也 通过 结合 模拟 与 冷却 系统 的 热 模 型 进行 量化 。 

另 一 项 研究 对 3D 集成 电路 封装 中 的 各 种 架构 配置 进行 了 热 分 析 ， 并 得 出 了 
结论 ， 除 非 引入 积极 的 局 部 主动 冷却 ， 和 否则 这 些 架 构 优 化 提升 中 的 一 些 措施 并 不 
能 发 挥 其 全 部 潜在 作用 。 对 具有 集成 微 通道 液体 冷却 的 3D YE CPU - DRAM it 
片 的 评估 显示 ， 由 于 集成 了 液体 冷却 ， 芯 片 的 性 能 提升 了 2. 62 1. 。 在 相同 的 
热 环境 条 件 下 ， 与 没有 应 用 液体 冷却 技术 的 类 似 芯 片 相 比 ， 液 体 冷却 基本 上 能 
实现 芯片 更 多 的 核心 数 、 更 复杂 的 内 存 控制 器 层次 结构 、 核 心 更 高 的 时 钟 频率 ， 
以 及 增加 总 的 任务 处 理 量 。 

冷却 系统 在 运行 时 的 管理 与 处 理 器 其 他 系统 管理 任务 的 协调 配合 也 引起 了 研 
究 者 的 关注 ， 通 过 可 变 流 量 控制 来 动态 管理 液体 冷却 系统 是 早期 研究 课题 之 
—U9». 已 经 提出 了 一 种 控制 器 用 来 调节 液体 的 流量 ， 从 而 可 以 保持 泵 体 的 能 
耗 ， 并 且 为 了 应 对 最 坏 情 况 下 的 冷却 需求 ， 冷 却 系统 不 需要 过 度 设 计 。 流 量 控制 
机 制 与 作业 调度 器 进行 结合 ， 可 以 满足 所 需要 的 冷却 需求 ， 同 时 确保 3D 集成 电 
路 的 温度 变化 以 及 泵 体 消耗 的 功 耗 最 小 。 所 需 的 冷却 需求 转化 成 一 个 目标 液体 流 
量 ,根据 泵 制造 商 提 供 的 技术 规格 ， 该 流量 又 与 泵 功率 有 关 。 这 项 研究 中 用 于 模 
拟 的 功 耗 来 自 于 为 服务 器 处 理 器 芯片 提供 冷却 的 泵 功 耗 ， 泵 制造 商 提 供 的 功 耗 技 
术 规 格 如 图 4.9 PTR], 

控制 器 接收 3D 集成 电路 处 理 器 中 片上 温度 传感器 的 温度 反馈 。 本 研究 注意 
到 ， 预 测控 制 器 与 反应 控制 器 两 者 之 间 的 选择 取决 于 泵 对 其 流量 的 更 新 响应 时 间 
的 长 短 以 及 芯片 的 热 时 间 常 数 。 在 该 研究 中 ，3D 集成 电路 芯片 的 热 时 间 常 数 
( 约 100ms) 小 于 泵 改变 其 流量 的 延迟 时 间 ( 约 300ms) 。 因 此 ， 采 用 了 预测 控制 
机 制 。 其 中 使 用 最 近 一 次 温度 传感器 的 反馈 ， 对 下 一 个 采样 周期 做 出 流量 预测 ， 
ARMA 方法 已 用 于 预测 下 一 个 采样 周期 的 最 高 温度 。 对 于 存在 多 个 温度 高 低 水 
Æ, IC 芯片 设计 成 使 峰值 温度 降 回 到 预先 设 定 的 阔 值 所 必需 的 最 小 流量 ， 在 本 
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流量 /L/h) 
图 4.9 用 于 服务 器 液体 冷却 的 泵 流量 与 功 耗 之 间 的 关系 图 
(数据 来 自 于 制造 商 发 布 的 数据 表 ， 并 描述 了 流量 与 功 耗 之 间 的 线性 关系 ) 

研究 中 将 温度 浆 值 设 定 为 80%C ， 该 信息 存储 在 LUT 中 ,控制 器 可 访问 该 表格 ， 
并 基于 下 一 个 执行 周期 的 温度 预测 来 确定 系统 运行 时 所 需 的 流量 。 在 该 研究 中 ， 
假设 系统 中 所 有 微 通 道中 的 流量 是 相同 的 。 另 一 种 方法 考虑 了 独立 地 控制 多 个 微 
通道 中 流体 的 流量 ， 以 便 在 3D 多 核 高 速 缓存 处 理 器 上 产生 均匀 的 温度 分 布 !%] 。 
控制 锅 依 赖 于 系统 消耗 的 功 耗 反馈 来 预 估 未 来 的 温度 曲线 。 基 于 此 目的 ， 通 过 
Kalman 滤波 可 实现 校正 的 自 回归 ( AutoregRessive, AR) 温度 预测 ， 以 预测 和 校 
正 系统 运行 时 的 功率 。 通 过 一 个 简化 的 模型 ， 该 信息 可 被 转换 成 温度 预测 。 为 了 
响应 温度 的 预测 ， 对 每 个 微 通 道中 液体 的 流量 进行 精细 的 分 配 和 控制 。 而 另 一 方 
面 ， 动 态 地 控制 每 个 单独 微 通道 的 液体 流量 并 对 流量 进行 优化 将 造成 显著 的 计算 
开销 。 冷 却 系统 中 的 多 个 微 通道 聚集 形成 微 通道 秘 ， 每 个 微 通道 徐 具 有 专用 的 
泵 ， 以 实现 设计 复杂 性 与 冷却 效率 优化 之 间 的 平衡 。 在 该 研究 中 ， 每 个 控制 周期 
约 为 600ms， 并 在 每 个 控制 周期 的 开始 时 段 ， 为 每 个 微 通道 复 预 测 该 微 通道 篮 区 
域 中 心 片 的 最 高 温度 。 如 果 预 测 的 温度 高 于 设 定 的 国 值 ， 则 流量 将 会 增加 。 如 果 
温度 小 于 阔 值 ， 则 流量 会 降低 。 液 体 流量 的 每 次 更 新 与 经 验 因子 oc 缩放 的 温度 
差 的 二 次 方 成 正比 关系 ， 如 式 (4.19) 所 示 。 

FlowRate{ n +1] = FlowRate[n] +1 * a(T,4, — Tja)? | (4. 19) 

微 通道 中 流量 的 动态 管理 也 可 以 与 设计 时 流量 的 分 配 与 布置 相 结 合 。 有 一 种 

方法 认为 ， 在 有 较 高 冷却 需求 的 位 置 ， 微 通道 的 非 均匀 布置 和 分 配 可 能 导致 比 
3D 集成 电路 堆 释 芯 片 中 所 有 层 与 层 之 间 的 微 通道 均匀 分 布 更 有 效 的 冷却 1%] 。 在 
设计 3D 堆 秋 芯片 时 ， 通 过 考虑 IC 芯片 上 硅 通 孔 的 位 置 来 确定 可 能 放置 微 通道 
的 可 选 位 置 ， 这 就 形成 了 一 组 微 通 道 可 选 位 置 的 网 格 。 泵 功率 近似 于 系统 中 所 有 
NN 个 微 通道 的 流量 和 压力 降 的 乘积 ， 如 式 (4.20) 所 示 。 
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" 
Pa, = Èi flow, x Ap, (4. 20) 


回顾 关系 式 (4.16) 中 定义 的 压力 降 、 通 道 几 何 形 状 ， 以 及 流量 之 间 的 关 
系 ， 如 果 假 定 所 有 通道 的 几何 形状 是 恒定 不 变 的 ， 那 么 液体 的 流量 可 以 用 压力 降 
来 表示 。 所 以 ， 泵 的 总 功 耗 将 是 每 个 通道 压力 降 和 微 通 道 总 数 的 函数 。 

然后 ， 有 两 种 方式 可 以 优化 液体 冷却 系统 。 第 一 种 方式 ， 把 优化 问题 视 为 单 
纯 的 液体 通道 分 配 问题 。 其 中 假设 在 所 有 通道 中 ,液体 流动 为 充分 发 展 的 层 流 ， 
通道 尺寸 是 恒定 不 变 的 ， 通 道 的 压力 降 也 保持 不 变 。 在 这 种 情况 下 ， 微 通道 的 分 
配 (通道 的 位 置 和 数量 ) 就 变 成 了 芯片 上 通道 位 置 网 格 区 域内 受 最 大 允许 温度 
影响 的 优化 问题 ， 目 标 函 数 是 使 泵 消耗 的 总 功率 最 小 。 第 二 种 方式 ， 通 道 的 压力 
降 被 视 为 变量 ， 并 与 微 通道 分 配 共同 优化 。 

改善 3D MPSoC 芯片 的 热 问题 也 受到 了 人 们 的 关注 ， 因 为 3D MPSoC 芯片 已 
经 发 展 成 为 许多 高 密度 集成 的 高 性 能 、 高 发 热量 的 芯片 。 即 使 在 液体 冷却 的 情况 
下 ， 温 度 监 测 在 这 些 系 统 的 整体 热管 理 中 仍然 起 着 至 关 重 要 的 作用 ， 这 是 近来 关 
于 组 合 传感器 位 置 排 布 与 热管 理 的 建议 中 所 强调 的 [%] 。 在 该 项 研究 中 ， 对 一 个 
4 ELE MPSoC 芯片 进行 了 分 析 。MPSoC 芯片 中 微 通道 蚀刻 在 每 个 堆 钱 层 的 
硅 基 材料 上 。 在 运行 过 程 中 ， 每 一 堆 番 层 上 微 通 道内 液体 的 流量 由 某 一 专用 泵 进 
行 独立 的 管理 控制 。 利 用 状态 空间 表示 法 来 表示 3D MPSoC 芯片 的 热 响应 ， 其 被 
分 解 成 多 个 单元 网 格 。 系 统 中 的 状态 数量 与 单元 网 格 对 应 ， 温 度 被 模拟 〈 估 算 ) 
出 来 。 传 感 器 的 位 置 放置 问题 对 应 于 确定 这 些 网 格 单元 的 位 置 (状态 ) 哪些 将 
包含 有 温度 传感器 。 通 过 量化 网 格 单元 在 该 系统 中 热 传 递 的 作用 ， 利 用 状态 空间 
实现 的 Gramian 平衡 :”] ， 采 用 模型 降 阶 技术 来 消除 对 系统 响应 贡献 最 小 的 那些 
状态 。 相 同 的 原理 可 用 来 识别 对 热 事 件 最 具有 辨别 性 的 单元 ， 并 且 最 少数 量 的 这 
些 位 置 被 识别 出 来 用 来 放置 温度 传感器 ， 同 时 使 可 观察 性 得 到 最 大 化 。 给 出 系统 
可 观察 性 矩阵 的 秩 的 目标 值 ， 并 且 把 传 感 费 的 位 置 添加 到 解 中 ， 直 到 达到 该 可 观 
察 性 的 目标 值 。 在 运行 时 ， 降 阶 热 模 型 用 于 评估 系统 的 热 像 图 ， 其 中 将 温度 传 感 
器 的 反馈 应 用 于 状态 评估 函数 (将 使 用 到 3. 3. 1. 2 节 中 讨论 过 的 技术 )， 以 评估 
不 同 IC 位 置 的 冷却 需求 。 在 满足 这 种 冷却 需求 的 前 提 下 ， 调 节 液 体 冷 却 系统 中 
的 流量 ， 直 到 泵 的 转速 达到 最 小 。 该 动态 管理 方案 还 同时 协调 芯片 的 工作 电压 和 
频率 。 解 决 了 每 个 离散 控制 周期 的 闭环 控制 优化 问题 ， 以 确定 所 有 泵 的 工作 电 
压 、 时 钟 频率 以 及 流量 。 

最 新 的 研究 结合 了 很 多 方面 的 设计 ， 包 括 热 感知 布局 规划 、 硅 通 孔 集成 、 快 
速 热 仿真 ， 以 及 液体 冷却 ! 噶 -各 1。 这 些 研究 涉及 越 来 越 多 的 系统 ， 包 括 堆 琶 内 
存 存储 器 、GPGPU 、 光 子 电路 、 电 源 电路 等 ， 并 且 处 理 忌 片 级 和 封装 级 的 冷却 。 
液体 冷却 技术 将 在 宏观 尺度 的 数据 中 心 和 机 柜 级 的 超级 计算 机 上 保持 显著 的 影响 
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(在 第 5 章 中 将 简要 讨论 这 种 抽象 层级 的 冷却 ) 。 同 时 ， 本 章 讨论 的 有 关 世 片 级 
主动 冷却 解决 方案 的 高 水 平 开 发 工作 ， 为 片上 主动 式 冷却 的 未 来 提供 了 有 趣 的 新 
的 解决 方案 。 


4.2.3 直接 液体 冷却 


最 后 ， 不 需要 管道 和 泵 循环 的 一 种 替代 方案 是 直接 液体 冷却 技术 5 71051 
直接 液体 冷却 允许 冷却 剂 液体 与 电子 器 件 直接 进行 物理 接触 ， 因 此 需要 使 用 电 绝 
缘 材 料 作为 冷却 剂 液体 。 将 电 绝缘 液体 注入 发 热 表 面 上 ， 液 体 吸 收 热量 后 蒸发 。 
使 用 电 绝缘 液 体 确保 芯片 和 周围 的 信号 线 、 电 源 线 可 以 与 冷却 剂 直 接 接触 ， 同 时 
保持 电气 绝缘 。 全 氟 化 碳 以 及 氧 氟 醚 是 这 种 冷却 剂 的 合适 选择 021 。 直 接 液体 冷 
却 可 以 通过 浸没 或 者 通过 射流 冲击 来 实现 ， 该 射流 冲击 指向 发 热 表 面 上 某 特 定 
的 点 。 


4.3 热电 冷却 


通过 使 用 特殊 设计 的 微型 热泵 ， 主 动 冷却 技术 可 以 提供 特定 位 置 按 需 冷却 ， 
在 高 性 价 比 冷却 方面 有 希望 成 为 新 的 机 遇 。 更 重要 的 是 ， 提 供 精细 可 调 的 冷却 能 
力 对 1C 芯片 和 系统 的 热 感知 设计 具有 显著 的 影响 。 主 动 冷却 系统 、 温 度 监 控 系 
统 ， 以 及 架构 级 的 热管 理 逻 辑 可 以 协同 地 运行 ， 以 便 在 安全 的 工作 温度 下 实现 性 
能 的 提升 。 在 前 面 的 章节 中 已 经 讨论 了 利用 液体 冷却 实现 该 范例 的 方法 和 技术 ， 
另 一 种 有 应 用 前 景 的 芯片 集成 式 主动 冷却 技术 利用 了 热电 现象 。 

热电 冷却 (TEC) 是 最 易于 使 用 的 技术 之 一 ， 在 长 期 的 实际 应 用 中 ， 存 在 现 
成 的 热电 冷却 器 件 。 虽 然 20 世纪 50 年 代 以 前 的 冷却 器 件 由 于 已 知 金 属 的 配对 不 
良 而 造成 效率 不 高 ， 热 电 材料 新 时 代 的 出 现 主要 归 因 于 20 世纪 50 年 代 中 期 引入 
化 合 磅 化 物 (Bi; Te, ) HW%] 和 合金 技术 ”]。 

近年 来 ， 从 冷却 功率 电子 器 件 和 激光 器 到 人 类 自身 ,分 立 式 TEC 元 件 已 经 
在 系统 中 得 到 广泛 的 应 用 [1 -02] 。 然 而 ， 将 这 样 的 分 立 式 TEC 元 件 集成 到 芯片 
封装 中 并 且 进 一 步 用 于 芯片 集成 热点 的 冷却 通常 是 不 可 取 的 ， 因 为 使 用 的 热电 材 
料 较 厚 ， 如 此 一 来 分 立 式 器 件 的 热泵 能 力 将 会 受到 限制 。 减 小 热电 材料 的 厚度 有 
助 于 提高 热泵 的 能 力 。 例 如 ，TEC 器 件 的 厚度 小 于 50pm， 热 泵 的 能 力 很 有 可 能 
达到 500 W/cm? 531。 在 过 去 几 年 中 ,文献 中 报道 了 薄膜 TEC 装置 的 显著 进步 ， 
已 经 提出 了 Sum 厚度 的 Bi Te; 超 唱 格 TEC 装置 ， 其 估计 能 够 达到 500W/cm? 的 
YHA) 。 研 究 人 员 已 经 研究 了 常规 主体 材料 在 硅 衬 底 上 的 单 片 集 成 电路 ， 
利用 IC 制造 工艺 使 其 沉积 为 20km SUBURB SS PELIS) 。 有 文献 曾经 报道 了 TEC 器 
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件 最 大 100 W/em? 9790 88 TT, AX TEC 器 件 (厚度 约 为 100pm) 可 以 安装 
在 散热 器 上 ， 这 证 明了 一 种 可 行 的 芯片 封装 级 的 集成 解决 方案 !16] 。 最 近 ， 人 们 
已 经 证 明了 从 纳米 结构 的 Bi Tes 薄膜 超 品格 制造 的 热电 冷却 器 集成 到 电子 封装 
中 (131。 据 报道 ,在 一 个 具有 局 部 热 通 量 高 达 1300 W/ em? 的 硅 芯 片上 的 目标 区 
域内 ， 按 需 制冷 存在 7. 3% 的 摆动 。 

这 些 TEC 元 件 封装 级 和 芯片 内 置 集成 的 早期 发 展 为 TEC 元 件 优化 和 芯片 级 
集成 问题 的 设计 自动 化 方面 的 工作 铺 平 了 道路 。 接 下 来 ， 我 们 首先 要 介绍 TEC 
元 件 的 基本 工作 原理 ， 然 后 再 讨论 这 种 令 人 激动 的 技术 在 芯片 冷却 和 热管 理 方面 
做 出 的 最 新 贡献 。 


4.3.1 TEC 装置 的 工作 原理 及 性 能 指标 


TEC 器 件 通 常 由 一 对 不 同 的 长 条 形 半导体 材料 组 成 ， 半 导体 材料 在 电气 性 
能 方面 进行 串联 ， 而 在 热学 性 能 方面 进行 并 联 ， 如 图 4. 10 tas, PAH Bae 
的 原理 就 是 帕 尔 帖 效应 ， 即 当 电 流通 过 长 条 形 半导体 材料 时 ， 在 一 侧 吸收 热 
量 ， 而 男 一 侧 释 放 热 量 。 在 温度 7. 和 7 条 件 下 ， 冷 面 一 侧 ( 冷 端 ) 吸收 的 热 
EHER, AEM 〈 热 端 ) 释放 的 热量 用 01 表 示 ， 以 下 方程 描述 了 热电 
冷却 的 原理 。 


Pet BR Gh) Feat eR Gh) 
lm » = 
i — i — 
Cu 


pP =< p = pu 
aL CHW) si aA OAN) 
a) b) 


3 4 FF 
A "4 L /A 


á Pd FF 
/ f pa J 


pe / A 


L L ' 207 
ve va L "» T 
E ms ». [ s 


f 


/ 


J 


i — : 


一 


c) 


Al 4.10 
a) 单个 TEC 器 件 的 侧 视图 b) 多 个 TEC 器件， 电气 串联 、 热 并 联 
c) WE TEC 器 件 4x4 阵列 的 3D 视图 


Q. = aif, - T£ - K(T, - T.) (4,21) 
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Q, sail, e Tri? -ECT - TL) (4. 22) 


AP, i RIN TEC 器 件 的 工作 电流 ; o 表示 TEC 需 件 的 塞 贝克 系数 ; r 和 大 分 别 
表示 TEC 器 件 的 电阻 值 和 热传导 系数 。 式 (4.21) 和 式 (4.22) 中 第 一 项 表示 


消散 掉 ， 另 一 半 在 热 面 一 侧 消 散 掉 ; 第 三 项 来 至 从 热 面 一 侧 到 冷 面 一 侧 的 热 传 
te. TEC 器 件 的 输入 功率 表示 如 下 : 
Pc =Q, - Q, 2r? & oi( T, - T,) (4.23) 

在 稳 态 条 件 下 ，TEC dE PERS 48 A 2I STE RE HCBI A BTN PS HS Fr 
封装 内 的 热量 。 因 此 ，TEC 器 件 的 过 度 部 署 和 /或 TEC 器 件 供电 电流 大 小 的 不 适 
当 设置 可 能 会 导致 芯片 封装 过 热 。 

虽然 上 述 关 系 式 在 文献 中 被 广泛 使 用 ， 但 是 它们 都 忽略 了 伴随 帕 尔 帖 效应 的 
a ARENT NS) 。 汤 普 森 效应 是 由 于 赛 贝 克 系 数 对 温度 的 依赖 性 引起 的 。 然 
而 ,汤普森 效应 通过 用 (an +ac)/2 RER wa 来 解释 ， 其 中 ar 和 ac 分 别 表 示 系 
统 的 最 高 和 最 低 允 许 工作 温度 下 的 赛 贝 克 系 数 。 

为 了 提高 冷却 效果 ， 多 个 TEC 器 件 可 以 通过 电气 串联 、 热 并 联 的 方式 连接 
起 来 ， 如 图 4. 10b 所 示 。 图 4. 10e 展示 了 超 品格 薄膜 TEC 需 件 4 x 4 阵列 的 3D 
视图 ， 薄 膜 TEC 咒 件 占用 较 小 的 面积 ,例如 薄膜 TEC 器 件 的 7 x7 阵列 仅 具 有 约 
3. 5mm x3. 5mm 的 横向 尺寸 。 

图 4. 11 说 明了 芯片 热电 冷却 系统 以 及 其 与 芯片 封装 集成 的 组 成 结构 ， 冷 却 
系统 包含 了 一 组 TEC 器 件 。 这 些 TEC 器 件 包 骸 在 仿 片 核心 和 散热 器 之 间 的 TIM 
(Thermal Insulation Material) 材料 中 ，TEC 器 件 由 外 部 的 电流 源 驱 动工 作 。 


eee 薄膜 


到 4.11 TENE TEC 需 件 集成 在 芯片 封装 中 : TEC 冷却 器 件 可 以 由 扁平 结构 
单元 的 阵列 组 成 ， 并 骨 入 在 芯片 核心 与 散热 器 之 间 的 TIM 材料 中 


TEC 器 件 的 性 能 由 两 个 指标 来 表征 : 第 一 个 是 冷却 器 的 品质 因数 Z， 其 通常 
与 绝对 温度 组 合成 无 量 纲 数 。 热 电 冷 却 器 的 品质 因数 定义 如 下 : 
a 
“pr 
式 中 ，a 表示 热电 材料 的 赛 贝 克 系 数 ; p 和 & 分 别 表示 材料 的 电阻 率 和 导热 系 
数 。 用 于 IC 器 件 主动 冷却 装置 的 温度 范围 通常 介 于 300 ~400K。 虽 然 300K 以 下 


(4. 24) 
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温度 范围 热电 材料 的 品质 因数 更 高 ， 但 是 近来 对 于 芯片 冷却 技术 创新 的 主要 挑战 
是 在 室温 条 件 下 实现 薄膜 材料 的 品质 因数 Z 大 于 1。 截至 目前 ,已 通过 控制 晶 格 
结构 和 工程 超 品格 实现 了 品质 因数 的 提升 改善 ， 其 中 使 用 Bi,Te; 材 料 实现 了 杞 片 
VERI mA jJ] 10.19.0207 。 常 见 的 方法 包括 在 超 晶 格 中 生成 量子 点 结构 和 工程 
声学 失 配 以 阻挡 声 子 和 电子 的 传输 。 通 过 式 (4.21) 和 式 (4.24) 可 以 发 现 ， 
具有 越 高 的 赛 贝 克 系 数 、 越 低 的 电阻 率 和 导热 系数 的 材料 ， 将 会 得 到 热电 材料 两 
个 期 望 的 性 能 指标 。 

热电 冷却 器 的 性 能 系数 (Coefficient of Performance, COP) 定义 为 冷却 器 每 
单位 输入 功率 所 泵 送 的 热量 ， 即 


Q. 


Prec 
4.3.2 最 新 一 代 芯 片 内 置 冷 却 器 的 设计 


实现 用 于 芯片 冷却 的 高 COP 热电 冷却 器 的 第 一 步 是 ， 人 研究 能 够 安装 在 独立 
散热 器 上 最 佳 设计 的 热电 材料 :21 。 早 期 研究 成 果 评 估 了 空气 风扇 与 热电 冷却 器 
组 合 在 一 起 用 于 冷却 微 处 理 器 系统 ， 以 评估 在 较 宽 温度 变化 范围 条 件 下 的 冷却 性 
能 i 了 >] 。 热 电 冷 却 器 附 接 在 主板 的 散热 器 上 ， 而 且 只 有 当 检 测 到 散热 器 温度 超过 
设 定 的 冰 值 时 ， 处 理 器 才 启 动 热电 冷却 器 。 其 他 早期 的 研究 工作 主要 集中 在 热电 
冷却 器 的 设计 参数 方面 ， 其 中 一 个 参数 优化 是 TEC 器 件 的 几何 形状 。 研 究 人 员 
已 经 提出 了 用 于 确定 在 分 立 式 TEC 器 件 和 集成 在 散热 器 上 使 用 的 TEC 器 件 最 佳 
特征 尺寸 的 各 种 方法 ， 包 括 确定 TEC 器 件 几 何 形 状 的 数值 优化 方法 43.24] 和 用 
于 确定 TEC 器 件 最 佳 高 度 的 分 析 框 架 0125] 。 这 些 方 法 通常 旨 在 针对 被 冷却 IC 器 
件 在 给 定 发 热量 的 条 件 下 ， 实 现 TEC 需 件 的 最 佳 导 热 系数 和 电阻 率 。 另 一 个 重 
要 的 设计 参数 是 提供 给 TEC 器 件 的 偏 置 电流 ，TEC 器 件 偏 置 电流 与 其 冷却 效率 
之 间 存 在 着 紧密 的 关系 52,26] 。 对 于 一 个 给 定 的 发 热量 需求 或 者 在 被 冷却 系统 
和 环境 之 间 保 持 给 定 的 温度 差 ，TEC 器 件 存 在 一 个 最 佳 的 供给 偏 置 电流 ， 这 个 
电流 参数 对 于 TEC 器 件 的 工作 起 到 至 关 重 要 的 作用 ， 无 论 是 对 于 长 条 形 还 是 薄 
膜 型 TEC 需 件 。 最 近 的 关于 薄膜 TEC 器 件 的 最 佳 构 造 ， 特 别 是 在 芯片 冷却 方面 
的 应 用 将 在 后 面 的 章节 中 详细 的 讨论 。 

TEC 器 件 设计 的 最 后 一 个 方面 是 开发 有 效 的 分 析 评估 模型 来 评估 设计 方案 
All TEC 芯片 封装 集成 ， 这 需要 在 其 使 用 环境 内 ，TEC 器 件 的 热 响 应 和 电气 响应 
的 分 析 模 型 。 研 究 人 员 已 经 提出 了 等 效 热 网 路 模型 、 类 似 SPICE 的 模型 以 及 用 
于 TEC 器 件 稳 态 和 瞬 态 分 析 的 计算 模型 :27 -13] 。 这 些 早期 的 模型 涉及 复杂 的 电 
路 元 件 ， 例 如 由 电压 控制 的 电压 源 以 及 温度 依赖 的 热源 !30] 。 在 下 文中 ， 将 使 用 
该 模型 来 说 明 等 效 TEC 模型 的 主要 特征 。 


COP = 


(4.25) 
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4.3.2.1 内 置 热电 冷却 器 的 芯片 封装 热 模型 

可 根据 式 (4.21) 和 式 (4.22) 可 构建 TEC 器 件 的 等 效 热 模 型 ， 如 网 4. 12 
所 示 。 网 路 中 的 两 个 节点 代表 TEC 器件 的 热 端 
和 冷 端 ， 冷 端面 向 被 冷却 的 芯片 ， 而 热 端 面向 
散热 器 。 连 接 两 个 节点 的 热 导 体 用 来 模拟 
k(T, - T.) Wi, 焦耳 热效应 可 以 由 连接 到 热 端 
和 冷 端 两 个 节点 的 热源 表示 ， 每 个 热源 具有 
r^ /2 大 小 的 热量 。 在 冷 端 吸收 的 帕 尔 帖 热 
(aiT) 可 以 由 连接 冷 端 和 接地 节点 的 正 热 导体 
ai 表示 ， 其 代表 了 绝对 零度 。 同 样 ， 在 热 端 释 
放 的 帕 尔 帖 热 (aiT) 可 以 使 用 连接 热 端 和 接 
地 点 的 负 热 导体 -ai 来 表示 。 这 两 个 热 导体 的 
大 小 由 供电 电流 调节 ,体现 了 TEC 冷却 器 有 效 
热 阻 值 对 偏 置 电 流 的 依赖 关系 。 因 此 ， 在 图 图 4.12 ”热电 冷却 器 件 的 


4. 12 中 ， 使 用 箭头 表示 它们 是 “可 调节 的 热 导 等 效 热 网 路 
体 ”"。 此 外 ， 两 个 热 导体 g 和 g, 被 放置 在 热 / 冷 
节点 处 ， 用 来 表示 TEC 冷却 如 的 热 / 冷 端 与 芯片 封 流 之 间 的 接触 热 阻 。 应 当 注 意 


的 是 ， 该 网 络 仅 说 明了 一 个 热流 路 线 ， 真 实 的 TEC 偏 置 电流 i 实际 上 并 不 流 过 这 
些 “导体 ”中 的 任何 一 个 。 

基于 这 个 等 效 模型 ， 可 以 构建 一 个 描述 TEC 器 件 工作 以 及 其 与 环境 之 间 相 
互 作用 的 框架 图 。 图 4. 13a 展示 了 一 个 含有 TEC 品 件 的 芯片 封装 等 效 网 络 模型 。 


b) 
图 4.13 含有 TEC 器 件 系 统 的 广义 网 络 模型 简 例 


a) 节点 被 标记 为 所 对 应 的 抢 阵 G 是 完全 不 可 约 怎 阵 
b) 节点 被 标记 为 所 对 应 的 矩阵 G 不 是 完全 不 可 约 矩 阵 


Wa3k TEO- 


该 模型 是 由 导体 连接 而 成 的 网 络 ， 包 含 恒定 导体 和 可 调节 导体 ， 其 中 恒定 导体 必 
须 是 正 值 。 在 图 4. 13a 中 ， 以 粗 体 显示 的 导体 是 恒定 导体 。 这 些 恒定 导体 连接 子 
网 络 ， 在 子 网 络 中 标注 为 0 的 特殊 节点 被 定义 为 接地 节点 。 可 调节 导体 可 以 放置 
在 该 子 网 络 中 的 任何 节点 和 接地 节点 之 间 ， 在 图 4.13a 中 它们 用 带 箭 头 的 灰色 图 
标 表示 。 与 第 个 节点 相连 接 的 可 调节 节点 的 值 为 -qi， 其 中 i 是 代表 外 部 调节 
力 的 一 个 实数 (在 热电 冷却 系统 中 ，i 代表 供电 电流 )。 如 果 TEC 器 件 使 用 同一 
个 偏 置 电流 源 ， 则 所 有 可 调节 导体 共用 同一 个 i 值 。 可 调节 导体 的 值 可 以 是 正 值 
或 者 负 值 。 此 外 ， 为 了 使 我 们 的 分 析 适 用 于 热电 冷却 系统 ， 要 求 可 调节 导体 中 至 
少 一 个 是 负 值 ， 也 就 是 说 ， 至 少 一 个 a ,是正 的 。 

现在 可 以 通过 扩展 节点 分 析 技 术 对 热 稳 态 时 的 网 络 模型 进行 计算 。 我 们 使 用 
符号 SIL, HOT, fll CLD 表示 通用 等 效 热 网 络 模型 中 的 节点 集合 ， 该 网 络 模型 为 
一 个 芯片 封装 的 模型 ， 其 中 SIL 对 应 硅 层 中 的 所 有 节点 ，HOT 表示 TEC 器 件 热 
端的 一 组 节点 ， 以 及 CLD 表示 TEC 器 件 冷 端的 一 组 节点 。 向 量 忆 表示 每 个 节点 
的 输入 热 功率 ， 其 中 pl 表示 硅 栅 格 位 置 的 加 热 功 率 ， 如 果 ke SIL, r2/2, WR 
k e HOT U CLD， 否 则 为 0。 绝 缘 材 料 层 、 散 热 需 以 及 热 沉 中 代表 栅 格 位 置 的 节 
点 不 产生 任何 功率 /热量 。 然 后 ， 稳 态 温度 曲线 0 与 功率 曲线 p 相关 ， 通 过 如 下 
线性 方程 组 来 表示 : 


(G -iD)0-p (4. 26) 
xh, EE G AID 定义 如 下 : 
5 811 7&2 Set T Ein 
Oxixn Q4 0 CEST 0 
ay 0 
G = — 8k UNS > Su cU 7 Ekn D = ak 
Oxixn 
0 
0 * 0 a, 
一 £u = 6m m > £u 
0</<n 
(4. 27) 


HH, gu RITA RIETI 1 之 间 的 热 导 (如 果 网 络 模型 中 节点 和 节点 1 不 相 
邻 ， 则 gj 等 于 0); WR e HOT, qF «o, WER e CLD， 则 a 等 于 -a， 
否则 a 等 于 0; a 代表 网 络 模型 中 传递 的 帕 尔 帖 热 。 

和 矩阵 G 具有 几 个 重要 的 特性 ， 可 以 用 于 TEC 器 件 的 架构 优化 。 例 如 ， 图 
4. 13a 中 的 标记 形成 完全 不 可 约 和 矩阵 G， 而 图 4. 13b 中 的 标记 则 不 会 。 在 不 失 一 
般 性 的 情况 下 ， 我 们 假设 对 芯片 封装 的 网 络 建 模 进 行 适 当 的 标记 ， 使 得 和 矩阵 G 
是 完全 不 可 约 的 ， 并 日 矩阵 D 左上 角 的 元 素 是 正 的 。 
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图 4. 13a 中 描述 的 网 络 模 型 只 包含 了 电阻 元 件 和 电流 源 ， 这 将 限制 其 进行 稳 
态 分 析 。 目 前 大 多 数 热电 芯片 冷却 系统 被 设想 为 在 特定 的 偏 置 电流 i 下 具有 恒定 
的 “NO” 的 TEC 需 件 。 在 这 种 情况 下 ,冷却 系统 不 需要 设计 成 具有 了 瞬 态 响应 特 
性 ， 稳 态 分 析 就 足够 了 。 男 一 方面 ， 未 来 的 热电 冷却 系统 可 以 作为 动态 热管 理 
(DTM) 机 制 的 一 部 分 以 协同 方式 进行 动态 控制 ,这些 TEC 器 件 的 热 模型 还 将 包 
含 等 效 网 络 模型 中 的 热 容 量 要 素 。 


4.3.3 热电 冷却 器 的 理论 分 析 框 架 


根据 线性 代数 中 经 典 特征 值 / 特 征 向 量 理论 的 扩展 ， 式 (4.26) 所 示 的 含有 
TEC 器 件 冷 却 系统 的 热 响 应 促进 了 综合 理论 分 析 框 架 的 发 展 。 在 本 节 中 ， 将 介 
绍 这 个 理论 分 析 框 架 的 推导 过 程 。 该 框架 为 TEC 器 件 世 片 冷却 系统 的 理论 性 能 
极限 提供 了 重要 的 理论 见解 (130-132]， 

除非 男 有 明确 的 说 明 ， 否 则 以 下 讨论 中 的 符号 固定 如 下 .: 

1) Ml 是 通过 保留 给 定 的 nxn 和 矩阵 MM 的 首 k 行 和 系列 形成 的 子 矩 阵 。 

2) 对 于 矢量 v = (v), RITA 

D 对 于 所 有 的 i， 当 且 只 有 当 v; 20 Hf, v 20; 

@) 对 于 所 有 的 i， 当 wv; 宇 0 时, v >0; 而 且 对 于 某 些 )， 至 少 存在 一 个 wj >0; 

@ FAA i, Wey, >0， 则 w >>0; 

3) 对 于 某 些 i ER, A(i) 2G-iD, 其 中 G 和 D 是 nxn WM, ARIA 
单 起 见 ， 使 用 4A(i) 代 表 A4。n 表示 网 络 模 型 中 节点 的 总 量 (除了 接地 节点 )。 

4) A,Ci) 2 Gk-iD,, Pi eR, 考虑 到 表达 简单 起 见 ， 我 们 用 A.X 
K AC). 

5) Hie A 的 逆 矩 阵 ， 也 就 是 说 , H(i) -AQG) T, HP BG) = (Og). 

6) hy (i) RRE H 58 k ATS LNA 


定义 1: 令 有 为 给 定 的 n xn AMA, WAR Ml 对 每 个 是 不 可 约 的 ， 那 
4 M 被 称 为 完全 不 可 约 和 矩阵 。 


定义 2: TARAKA ER Ex, WR xM »0, Win xn KERE 
M 为 正定 和 矩阵。 


定义 3: Stieltjes 矩阵 是 含有 非 正 数 的 非 对 角 元 素 的 实 对 称 矩 阵 033] 。 


dau rana IE 


论点 1: 给 定 包含 至 少 一 个 负 热 导体 的 广义 导体 网 路 模型 ， 总 是 可 以 标记 节 
点 ,使 得 矩阵 G 为 完全 不 可 约 和 矩阵 ， 以 及 抢 阵 娓 左上 角 的 元 素 a 为 正 值 。 


证 明 : 因为 芯片 封装 包含 至 少 一 个 TEC 器 件 ， 其 热 模型 包含 至 少 一 个 负 热 
导体 。 我 们 将 负 热 导体 的 非 接 地 端的 节点 标记 为 第 一 个 节点 ， 和 矩阵 D 的 左上 和 角 
的 元 素 将 是 正 的 。 从 这 个 节点 开始 ， 我 们 继续 标记 节点 ,使 得 每 次 最 新 标记 的 节 
点 与 已 经 标记 的 节点 中 的 至 少 一 个 相 邻 。 该 标记 顺序 确保 由 矩阵 G IH k TA k 
列 形成 的 子 和 矩阵 对 应 于 一 个 关联 分 量 和 矩阵 。 因 此 ， 和 矩阵 G 是 完全 不 可 约 的 。 


定理 4.1 IÈ (4.26) 中 的 矩阵 G 是 完全 不 可 约 的 正定 Stieltjes 矩阵 534] 。 

使 用 上 面 提出 的 基本 和 定义， 可 以 正式 地 分 析 TEC 需 件 的 重要 特性 ， 冷 却 效 
率 和 偏 置 电流 之 间 的 关系 就 是 其 中 一 个 至 关 重 要 的 参数 。 接 下 来 ， 利 用 这 个 分 析 
框架 ， 我 们 将 分 析 讨 论 TEC 吉 件 的 热泵 能 力 与 其 偏 置 电流 之 间 的 关系 。 


4.3.3.1 热电 冷却 系统 热 失控 现象 

对 于 TEC 器 件 ， 其 供电 电流 存在 一 个 上 限 值 ,使 得 大 于 和 的 任何 供电 电 
流 都 将 导致 TEC 器 件 的 热 失控 。 从 数学 的 角度 分 析 ， 随 着 供电 电流 接近 于 A, 
每 个 TEC 薄片 的 温度 将 会 接近 无 穷 大 。 道 正 矩 阵 理 论 1233] 可 以 用 于 证 明 上 限 A 
的 存在 。 


定理 4.2 给 定 一 个 正定 不 可 约 Stieltjes 矩阵 G， 具 有 人 至少 一 个 正 元 素 的 实 
XT FA FERED, A 定义 如 下 : 


0LD0 >0| (4. 28) 
Hn Az2G-iD, RNE: 

对 于 任何 i e[0,A), FARE A 为 正定 矩阵。 当 7=A IN, EEA 为 半 定 奇异 
矩阵。 


定理 4.3 AEE A 和 定理 4. 2 中 定义 的 实数 入 ， 并 表示 如 下 : 
五 =A4-!， 对 于 任何 1<k, l&n, 


1 一 > 人 一 
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图 4. 14 描述 了 h(i 让 是 i 的 函数 。 

注意 ， 根 据 式 (4. 26) 有 
0=4- -p-sH-p 

因此 ， 如 果 在 节点 ! 处 输入 每 单 
位 功率 ， 那么 如 | 的 物理 解释 就 是 节点 
的 温度 。 定理 4.3 揭示 了 ， 如 果 网 
络 中 有 一 个 节点 具有 非 零 的 输入 功 耗 ， 
M ; Beim 时， 每 个 节点 的 温度 将 
接近 无 穷 大 ， 即 表示 TEC 器 件 出 现 热 
失控 。 0 duo i 

热 失 控 的 物理 解释 为 : A 表示 使 
主动 冷却 系统 具有 有 零 热泵 能 力 的 输入 图 4. 14 对 于 冷却 系统 中 不 同 的 节点 ， 
电流 大 小 ， 因 为 帕 尔 帖 冷却 效应 被 欧 eO OAA TEC 供电 电流 i ha 
姆 热效应 和 热传导 所 抵消 。 在 有 关 热 电 冷 却 的 文献 中 ， 这 种 情况 发 生 在 当 热 电 冷 
却 器 的 COP 变 为 零 时 135]。 人 们 已 经 对 类 似 的 情况 进行 了 研究 ,但 是 在 不 同 的 
边界 条 件 下 11351， 该 现象 还 揭示 了 ， 用 于 芯片 冷却 的 TEC 器 件 参 数 的 优化 应 当 
限制 其 供电 电流 大 小 范围 在 [0, A) 以 内 ， 使 得 硅 材 料 层 的 最 高 温度 最 小 化 。 


4.3.4 基于 TEC 冷却 器 的 IC 芯片 热管 理 


设计 用 于 芯片 冷却 的 集成 式 TEC 器 件 的 整体 架构 以 及 配置 其 工作 参数 涉及 
独特 的 约束 条 件 和 设计 权衡 。 首 先 ， 集 成 过 多 数量 的 TEC 器 件 会 增加 芯片 封装 
的 成 本 。TEC 器 件 的 厚度 以 及 横 蕉 面积 大 小 应 该 从 成 本 效益 策略 的 角度 来 确定 。 

此 外 ， 向 TEC 器 件 输 入 大 电流 可 能 会 导致 世 片 封装 的 过 热 。 如 4 3.3 节 中 
所 述 ， 虽 然 TEC 器 件 的 热泵 能 力 随 着 供电 电流 的 增加 而 提高 ， 但 是 其 本 身 的 热 
功 耗 却 以 更 快 的 速度 增加 。 每 个 冷却 系统 (根据 其 散热 由 线 、 热 传导 性 和 TEC 
器 件 的 材料 ) 都 有 其 唯一 的 最 佳 工作 点 。 超 过 该 最 佳 工作 点 ，TEC 器 件 的 性 能 
将 呈现 指数 级 的 降低 。 

最 后 ， 需 要 为 TEC 器 件 设计 专用 的 电流 引 脚 ， 以 便 将 供电 电流 从 外 部 电源 
传输 给 集成 的 TEC 器 件 。 现 代 高 性 能 微 处 理 器 上 针 机 的 阵列 相当 拥 搞 ， 这 种 情 
况 在 将 来 只 会 变 得 更 严重 。 因 为 处 理 器 从 一 代 发 展 到 另 一 代 ， 数 据 /地 址 VO 总 
线 的 宽度 在 增加 ， 而 每 个 处 理 器 的 核心 大 小 却 在 持续 减 小 。 因 此 ， 留 给 额外 引 肝 
的 空间 会 更 小 。 此 外 ， 在 芯片 封装 内 ， 桥 接 引 脚 和 核心 上 1/0 口 的 互 连 已 经 非常 
密集 。 应 该 注意 到 ，TEC 器 件 的 典型 供电 电流 为 几 安培 的 量 级 。 因 此 ， 承 载 供 
电 电流 的 引 脚 必须 足够 宽 以 抑制 焦耳 热效应 。 然 而 ， 太 宽 的 引 脚 将 占据 较 大 的 布 
线 面积 。 因 此 ， 多 个 TEC 器 件 需要 被 连接 到 一 起 ， 并 由 一 个 单独 的 引 脚 供电 ， 
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以 便 使 所 需 的 引 脚 数量 最 少 。 
4.3.4.1 芯片 封装 中 TEC 冷却 器 的 分 配 与 优化 

早期 针对 基于 TEC 央 件 芯片 冷却 系统 的 自动 化 设计 ， 研 究 调查 了 确定 TEC 
器 件 最 佳 偏 置 电流 的 方法 ， 以 便 使 得 被 冷却 芯片 的 最 高 温度 始终 保持 在 安全 靖 值 
以 下 15531932] 。 假 设 给 定 一 个 由 pP x q 单元 阵列 组 成 的 薄片 ， 该 薄片 表示 芯片 管 世 
的 面积 ， 阵 列 中 每 个 薄片 单元 具有 与 TEC 器 件 相 同 的 面积 ， 并 且 基 于 被 冷却 世 
片 的 分 析 ， 给 定 每 个 薄片 单元 在 最 坏 情 况 下 消耗 的 功率 ,该 问题 及 其 目标 函数 
如 下 : 

判定 : 需要 被 TEC 需 件 覆盖 的 最 小 薄片 单元 组 ， 以 及 TEC 器 件 的 最 佳 供电 
电流 ; 

目标 : 硅 材 料 层 的 最 高 稳 态 温度 不 能 超过 最 大 人 允许 温度 。 

下 面 提出 了 一 种 迭代 算法 来 解决 这 个 问题 。 通 过 热 仿 真 ， 首 先 确认 管 芯 温 度 
超过 最 高 允许 工作 温度 0,,, 的 薄片 单元 组 7， 这 些 薄 片 单元 上 和 覆盖 有 TEC 器 件 。 
然后 ， 调 用 子 程序 来 计算 TEC 融 件 的 供电 电流 ， 针 对 给 定 的 TEC 器 件 部 署 使 硅 
材料 层 中 薄片 单元 的 峰值 温度 最 小 化 。 在 芯片 封装 中 增加 更 多 TEC i PEZ PS 
个 结果 ， 即 中 这 些 被 TEC 器 件 覆 盖 的 薄片 单元 温度 可 能 会 降低 ; @ 其 他 薄片 单 
元 的 温度 可 能 会 升 高 ， 因 为 新 增加 的 TEC 器 件 组 产生 了 芯片 封装 中 额外 的 热量 。 

为 了 将 TEC 器 件 的 每 个 部 分 都 部 署 到 芯片 管 芯 上 方 区 域 的 薄片 单元 ， 一 个 
特殊 的 子 程序 计算 TEC 器 件 的 供电 电流 ， 它 使 得 薄片 单元 的 最 高 温度 达到 最 低 。 

该 问题 可 以 通过 如 下 方式 表示 : 

最 小 化  maxi6,(i) | V ke SIL} 

“4(G-iD)0=p 时 , i=0 

对 于 供电 电流 的 理论 极限 值 A 最 大 允许 范围 的 研究 定义 了 最 佳 供电 电流 的 
查寻 空间 。 此 外 ， 研 究 已 经 表明 , 在 [ 0, 和 A) 范围 以 内 , 管 芒 薄片 单元 的 最 高 
温度 是 i 的 凸 函数 L130,13]。 利 用 这 个 结论 ， 可 以 确定 供电 电流 的 上 限 值 ， 然 后 采 
用 梯度 下 降 法 在 该 范围 内 执行 查寻 ， 以 求解 使 ,最 小 化 的 凸 函 数 的 优化 问题 。 
然后 对 该 分 析 框 架 进 行 扩 展 ， 以 处 理 TEC 器 件 阵列 的 子 区 域 可 由 不 同 的 专用 电 
流 引 脚 提供 电流 的 人 情况， 这 允许 更 大 的 优化 空间 来 满足 芯片 的 冷却 需求 。 

除了 用 向 量 电流 i 来 替换 标量 电流 ， 问 题 的 描述 是 相似 的 。 向 量 i 还 可 用 来 表 
示 每 个 单独 引 脚 的 供电 电流 。 此 外 ， 由 于 TEC 器 件 的 自身 发 热 对 芯片 总 发 热 功 耗 
的 贡献 ， 问 题 变 得 更 加 突出 。 现 在 ， 整 个 网 络 模 型 的 功率 分 布 取 决 于 供电 电流 i, 
因为 代表 TEC 器 件 热 端 / 冷 端的 节点 耗 散 了 焦耳 热 。 向 量 忆 (用 来 表示 每 个 节点 的 
耗 散 功率 。 然 后 ， 可 以 通过 求解 以 下 线性 方程 组 来 计算 稳 态 温度 分 布 曲 线 0 : 

(G -D(i))0-p(i) (4. 29) 
xh, FEM G FI D(i) EXT: 
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ABE G 和 式 (4.27) PAE CLAUSI, FER DC AX AAEM, HPR 
“45 keHOT U CLD, a,(i)AAWIES, ke HOT 时 ， a,(i) 等 于 赛 贝 克 系 
数 a 与 所 对 应 TEC 器 件 的 供电 电流 的 乘积 ; “4 ke CLD AY, o, (i) ESE GEAR 
数 与 供电 电流 乘积 的 负数 。 

现在 ， 可 以 定义 具有 多 个 专用 电流 源 的 最 佳 冷却 系统 配置 的 问题 如 下 : 

给 定 表示 芯片 硅 材 料 层 的 p x q 薄片 单元 阵列 ， 其 中 每 个 薄片 单元 具有 和 
TEC 器 件 相 同 的 面积 ， 并 且 给 定 每 个 薄片 单元 在 最 坏 情 况 下 消耗 的 功率 ， 以 及 
Jy TEC 融 件 提供 电流 的 引 脚 的 数量 n. 

判定 : QD 需要 被 TEC 融 件 覆盖 的 薄片 单元 组 ; @ 引 脚 与 TEC 器 件 的 映射 关 
系 ， 即 由 每 个 引 脚 供电 的 一 组 TEC 器 件 ; @ 每 个 引 脚 的 供电 电流 的 大 小 。 

HER: 对 于 给 定 的 最 坏 情况 下 的 功率 分 布 曲线 ， 使 芯片 管 世 最 高 稳 态 温度 
最 低 。 

该 问题 可 采用 松弛 和 四 含 五 人 的 策略 分 三 个 阶段 来 解决 。 阶 段 一 是 松弛 策略 
阶段 ， 通 过 原始 问题 的 变换 ， 使 得 : 中 每 个 薄片 单元 均 被 TEC 器 件 覆 盖 ; OA 
用 引 脚 的 数量 等 于 薄片 单元 的 数量 。 松 弛 策略 的 基本 原理 是 ， 如 果 TEC 器 件 的 
导热 系数 大 于 TIM 材料 的 导热 系数 〈 在 实际 应 用 中 就 是 这 种 情况 ) ， 具 有 有 零 供 电 
电流 的 TEC 器件 将 变 成 比 TIM 材料 导热 更 好 的 热 导 体 。 所 以 ， 松 弛 问题 的 最 优 
解 给 出 了 可 实现 的 硅 材 料 层 最 小 峰值 温度 的 下 限 。 

第 二 阶段 和 第 三 阶段 是 将 松弛 问题 的 解 “ 四 售 五 人 ”成 原始 问题 的 解 。 硅 
材料 层 中 的 发 热 是 极其 不 均匀 的 ， 只 有 一 小 部 分 的 薄片 单元 表现 出 了 超过 安全 极 
限 的 高 温 。 因 此 ， 在 松弛 问题 的 解 中 ， 大 多 数 TEC 器 件 的 供电 电流 将 为 零 。 这 
HE TEC 器 件 将 首先 从 芯片 封装 中 移 除 掉 。 然 后 ， 其 余 的 TEC 器 件 被 划分 成 mm 
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组 。 这 一 步 确 定 了 TEC 器 件 的 部 署 以 及 引 脚 与 TEC 器 件 之 间 的 映射 关系 。 

对 于 给 定 的 目标 芯片 ， 具 有 非 零 供 电 电 流 需 求 的 TEC 薄片 单元 分 布 直 方 图 
如 图 4. 15 所 示 。 在 该 示例 中 ， 直 方 图 中 存在 4 个 自然 形成 的 集群 。 为 了 解释 这 
些 集群 ,我们 注意 到 ， 对 于 第 一 阶段 近似 ，TEC 需 件 的 供电 电流 由 其 下 面 的 硅 
材料 薄片 单元 的 温度 确定 。 硅 材料 层 中 薄片 单元 的 温度 又 由 其 自身 和 周围 的 薄片 
单元 所 耗 散 的 功率 近似 地 决定 。 此 外 ， 我 们 还 注意 到 ， 在 相同 功能 区 内 的 薄片 单 
ea 从 这 些 组 件 之 间 的 空间 相关 性 方面 也 说 明 ， 履 盖 相 同 功 

能 区 TEC 器 件 的 供电 电流 的 大 小 将 彼此 相近 ， 它 们 在 供电 电流 直方 图 中 形成 同 
一 个 集群 。K - means 聚 类 技术 被 用 于 将 第 二 阶段 的 供电 电流 分 组 成 wa 个 集群 。 
同一 个 集群 中 的 TEC 器 件 将 连接 在 一 起 ， 并 由 一 个 专用 引 脚 提供 电流 。 
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图 4.15 TEC 器 件 非 零 供电 电流 分 布 直方 网 


在 最 后 的 “四 舍 五 人 ”阶段 ,确定 了 每 个 引 脚 合理 的 电流 大 小 。 在 第 一 和 
第 三 阶段 中 ， 都 使 用 了 特殊 的 搜索 查寻 算法 来 确定 每 一 个 TEC 融 件 集群 的 电流 
大 小 。 松 弛 问题 表示 如 下 : 

最 小 化 Omax 

Mg SO max Wk © SIL It 

(G -D(i))0-p(i) 

上 述 优 化 问题 的 参 变量 是 电流 矢量 i， 其 表示 每 个 电流 引 脚 的 供电 电流 。0 y 
是 矢量 9 的 第 个 元 素 , 它 表示 节点 的 温度 。 对 于 多 维度 的 情况 ， 电 流 矢量 的 
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搜索 查寻 空间 也 可 以 近似 地 用 凸 边界 加 以 约束 (331， 该 特殊 区 域 R 由 正定 矩阵 
G -D(i) 的 空间 来 定义 ， 其 中 正定 矩阵 GD(i) 包 含 零 向 量 (0, 0, =, 0)'。 
搜索 的 起 始点 是 零 向 量 (0, 0, =, 0) ,搜索 算法 遵循 梯度 下 降 法 ， 只 是 
在 当前 搜索 点 i 施加 下 降 步 长 Ai 之 前 ， 需 要 验证 矢量 (i + Ai) ETEK IR A, 
如 果 不 在 区 域内 , MERK i 减少 一 半 , 直 到 (i+Ai) 在 RR 以内。 为 了 检查 (i+ 
Ai) 是否 在 RR 以内， 只 需 检查 矩阵 G -DD(i) 是 否 是 正定 矩阵 就 足够 了 。 类 似 于 单 
个 电流 引 脚 的 情况 ， 这 个 问题 可 以 使 用 Cholesky 分 解 算法 来 完成 022] 。 

图 4. 16 展示 了 一 个 案例 分 析 ， 其 中 任何 TEC 器 件 阵列 都 与 微 处 理 器 内 核 集 
成 在 一 起 ， 世 片 和 TEC 器 件 层 被 划分 成 包含 144 个 薄片 单元 的 12 x 12 He. BI 
4. 16b ~d 分 别 描述 了 配备 一 个 、 两 个 和 三 个 电流 引 脚 的 TEC 器 件 的 部 署 情况 。 
对 于 TEC 器 件 可 用 的 4 个 不 同 大 小 的 电流 水 平 ( 见 图 4.16d)， 冷却 浮 点 加 法 器 
的 两 个 TEC 器 件 属 于 由 Pind 供电 的 集群 。 两 个 TEC 器 件 用 来 冷却 浮 点 乘法 器 ， 
形成 了 由 Pind 供电 的 另 一 个 集群 。 整 数 执行 单元 和 整数 寄存 器 文件 上 的 大 多 数 
TEC 器 件 形 成 了 由 Pin2 供电 的 第 三 集群 ， 其 余 的 TEC aT T Hi Pink 供电 的 第 
四 个 集群 。 目 标 工作 负载 是 浮 点 密集 型 基准 程序 的 组 合 ， 与 其 他 功能 单元 相 比 ， 
浮 点 功能 单元 明显 具有 更 大 的 功率 密度 。 因 此 ， 当 存在 4 个 引 脚 可 用 时 ,冷却 这 
两 个 浮 点 功能 单元 的 TEC 器 件 形 成 两 个 单独 的 集群 。 当 只 有 两 个 引 脚 可 用 (D 
图 4. 16b) 时 ， 这 两 个 浮 点 功能 单元 上 的 TEC 器 件 形成 一 个 集群 ， 其 余 的 形成 第 
二 个 集群 。 
4.3.4.2 计算 系统 中 TEC 器 件 集 成 的 管理 

对 于 热电 芯片 冷却 ， 根 据 前 面 章节 中 描述 的 关于 材料 、 工 艺 ， 以 及 设计 自动 
化 方法 的 早期 研究 结果 ， 形 成 了 一 个 新 的 、 活 跃 的 研究 和 创新 领域 。 以 下 将 讨论 
关于 集成 式 TEC 器 件 的 设计 与 管理 。 

最 近 一 项 实验 研究 调查 了 TEC 器 件 的 工作 电压 、 热 源 功 耗 (CPU 系统 ) ， 以 
及 TEC 模块 的 数量 对 热电 冷却 器 总 COP 性 能 指标 的 影响 536] 。 该 系统 从 宏观 尺 
才 的 角度 进行 研究 , 使 用 尺寸 为 40mm x 40mm x3. 8mm 大 小 的 TEC 器 件 安 装 到 
主板 上 的 散热 器 ， 实 验 结果 证 实 了 不 同 尺 寸 之 间 趋 势 的 相似 性 。 

其 他 一 些 研 究 评估 了 由 冷却 风扇 和 热电 冷却 模块 组 成 的 HY 系统 的 冷却 性 
能 。 基 于 笔记 本 电脑 出 现 的 新 的 冷却 需求 ， 其 中 一 个 研究 评估 了 热电 冷却 在 笔记 
本 电脑 上 的 应 用 !57] 。 该 实验 研究 了 使 用 现成 的 TEC 模块 来 构建 附 接 到 空气 冷 
却 散热 器 上 的 冷却 系统 ， 并 开发 出 了 TEC 器 件 和 翅 片 散热 器 的 详细 热 模 型 。 虽 
然 使 用 了 市 场 现 有 的 TEC 器 件 ， 但 是 作为 研究 的 一 部 分 ， 优 化 了 散热 器 的 几何 
尺寸 以 求 在 一 个 典型 的 笔记 本 电脑 上 达到 最 佳 气流 和 冷却 的 目的 。 基 于 获得 的 热 
模型 的 理论 预测 表明 ， 相 对 于 被 动 冷却 ， 该 集成 冷却 器 的 冷却 性 能 可 提高 4 ~ 
8 倍 。 
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从 系统 所 消耗 的 总 冷却 能 耗 的 角度 来 看 ， 也 可 以 考虑 两 种 不 同类 型 的 冷却 系 
统 进行 协同 工作 。 调 查 研究 了 强迫 对 流 冷 却 系统 和 热电 冷却 器 系统 的 功率 感知 管 
理 ， 该 功能 以 冷却 能 耗 为 主要 优化 目标 [38] 。 使 用 TEC 器件 可 以 提供 按 需 冷却 ， 
该 冷却 方式 仅 集中 在 某 些 具体 的 热点 上 ， 从 而 可 以 显著 减轻 主要 冷却 机 制 的 工作 
负载 。 如 本 研究 所 证 实 的 ， 可 以 促使 总 冷却 成 本 的 降低 。 它 还 可 以 实现 更 紧凑 和 
更 具有 成 本 效益 的 散热 器 ， 并 降低 被 动 冷 却 系 统 的 生产 成 本 。 

对 于 具体 平台 的 TEC 器件 技 术 参 数 的 优化 比如 工作 电流 ) 已 经 进一步 扩 
展 到 了 性 能 模式 的 概念 053?] 。 特 别 对 于 微 处 理 器 的 冷却 ， 在 基于 系统 冷却 为 目的 
的 预防 性 热管 理 和 基于 热 应 急 为 目的 的 干预 性 热管 理 之 间 存 在 区 别 。 研 究 发 现 ， 
当 以 追求 最 大 反 向 热 梯度 为 目的 时 与 以 追求 高 COP 指标 和 高 能 效 的 稳 态 冷却 为 
目的 时 的 TEC 器 件 参 数 设置 存在 差异 。 

数据 中 心中 用 于 处 理 吉 冷却 的 热电 冷却 器 大 规模 系统 级 的 效率 评估 给 出 了 一 
个 令 人 鼓舞 的 结论 L011。 数 据 中 心 冷却 系统 通常 设计 用 于 确保 整个 系统 中 具有 最 
大 热 应 力 的 处 理 器 的 可 靠 性 ， 这 可 能 会 造成 过 度 设计 并 导致 很 高 的 冷却 能 源 成 
本 。 提 高 数据 中 心中 空气 冷却 系统 的 进 风 温度 可 以 产生 很 大 的 经 济 收 益 ， 然 而 ， 
因为 热 应 力 导 致 的 故障 率 可 能 也 会 随 之 增加 。 目 前 ， 数 据 中 心 组 织 遵循 不 同 级 别 
对 数据 中 心 进行 等 级 划分 ， 其 中 一 些 数据 中 心 依赖 于 在 处 理 器 芯片 中 设置 固有 的 
温度 安全 余 量 来 支撑 提高 的 工作 环境 温度 。 当 数据 中 心 运行 环境 温度 较 高 时 ， 在 
选择 的 处 理 器 芯片 上 使 用 TEC 冷却 器 有 助 于 维持 系统 的 总 体 可 靠 性 ， 这 些 处 理 
器 芯片 在 热 负 载 方 面 明显 具有 较 大 的 劣势 (由 于 具体 位 置 、 进 风 温 度 高 、 活 动 
不 均衡 、 负 载 分 布 等 ) 。 


4.4 相 变 冷却 


相 变 材料 (PCM) 具有 很 大 的 蓄 热 能 力 ， 随 着 热量 的 输入 它们 的 温度 会 逐 
渐 升 高 ， 直 到 达到 相 变 的 温度 点 。 在 相 变 点 处 ， 相 变 材 料 表现 出 在 恒定 温度 下 能 
够 吸收 大 量 热量 的 独特 能 力 ， 因 为 它们 将 从 一 种 相 态 转变 成 另 一 种 相 
ARUM 148) ， 这 种 特性 也 被 称 为 潜 热 存储 。 人 们 对 固 - 液 相 变 材料 在 芯片 冷却 领 
域 引 起 很 大 的 兴趣 ， 并 且 已 经 实际 用 于 替代 散热 器 材料 和 热 绝 缘 材料 。 特 别 在 移 
动 计 算 领 域 ， 诸 如 PCM 技术 这 种 空间 占用 小 、 重 量 轻 的 解决 方案 可 能 是 有 影响 
力 的 。 它 们 可 以 大 大 降低 常规 散热 材料 所 需要 的 体积 ， 并 且 允 许 系 统 在 安全 的 温 
度 限 制 下 运行 ， 而 不 需要 冷却 风扇 。 

因此 ， 该 领域 的 热学 工程 师 也 认识 到 了 这 一 潜力 , 并 在 手持 设备 中 出 现 了 使 
用 基于 PCM 的 冷却 解决 方案 的 一 些 提议 。 基 于 PCM 的 冷却 方案 特别 适用 于 设备 
功率 突然 输出 ， 如 果 这 样 的 功率 峰值 持续 时 间 短 暂 ，PCM 材料 有 助 于 缓解 功率 
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突然 输出 时 的 热 问题 。 像 其 他 所 有 冷却 解决 方案 一 样 ， 基 于 PCM 材料 的 冷却 方 
案 设 计 参 数 也 需要 进行 优化 。 不 同 PCM 材料 之 间 的 导热 系数 不 同 ， 为 了 提高 其 
导热 系数 ， 材 料 的 选择 及 材料 本 身 可 能 的 改善 和 提升 对 冷却 系统 的 整体 效率 是 非 
常 重要 的 。 例 如 ， 人 熔化 温度 范围 较 宽 的 普通 有 机 PCM 材料 (如 石蜡 ) 的 导热 系 
数 较 低 (0.21 ~0.24W/m . K)。 低 导热 系数 的 PCM 材料 可 以 通过 加 入 高 导热 系 
数 的 固定 物质 来 提高 其 导热 性 能 5 1 。 与 PCM 材料 一 起 ， 合 成 材料 通常 由 诸如 
铜 、 铝 、 镍 和 碳纤维 材料 组 成 ， 其 中 使 用 比如 翅 片 、 蜂 赛 结构 、 羊 毛 制品 等 作为 
支撑 结构 。 市 场 上 销售 的 基于 PCM 材料 的 处 理 器 散热 器 通常 使 用 合适 的 混合 
根据 给 定 平台 的 冷却 需要 ， 可 以 调节 其 在 具体 的 、 容 易 控 制 的 温度 范围 内 熔化 并 
吸收 热量 ， 这 些 混合 物 的 导热 系数 提高 了 好 几 个 数量 级 。 智 能 手机 上 用 于 皮肤 温 
度 控制 的 PCM 材料 可 以 设计 在 36 ~43 气 范围 内 实现 潜 热 的 储存 ， 以 解决 用 户 在 
使 用 时 与 温度 相关 的 不 适 性 04] 。 适 用 于 芯片 管 芯 、 热 扩散 器 以 及 散热 器 之 间 的 
PCM 化 合 物 在 5$% 时 即 会 发 生 相 变 ， 还 存在 具有 较 高 导热 系数 的 低温 熔点 金属 
PCM 材料 ， 比 如 史 罗 本 德 低 熔点 合金 (19W/m + K) Mi (33. 7W/m - K) D4, 
金属 PCM 材料 的 主要 缺点 是 重量 较 重 ， 这 与 峰值 输入 功率 、 封 装 方向 ， 以 及 熔 
化 /冷冻 时 间 一 样 是 电子 封装 的 重要 成 本 问题 0483] 。 建 模 对 于 评估 该 冷却 技术 的 
优点 和 局 限 性 以 及 确定 其 最 佳 设计 参数 都 至 关 重 要 。 从 详细 的 CFD 模型 0471 到 
等 效 RC - 网 络 模型 [148] ， 研 究 人 员 已 经 进行 了 不 同 粒 度 粗 细 级 别 和 相关 计算 复 
杂 度 的 各 种 建 模 尝试 。 开 发 了 一 个 更 新 的 模型 ， 其 追求 一 种 精细 的 平衡 ， 以 改善 
先前 的 RC 网 络 模型 。 考 虑 到 局 部 发 热 、 不 均匀 热 扩 散 ， 以 及 沿 PCM 表面 的 熔 
点 分 布 ， 以 实现 精确 而 计算 高 效 的 模型 L191。 使 用 该 模型 ， 还 构建 了 一 个 用 于 
PCM 材料 物性 设计 开发 的 框架 。PCM BBLS EERE AIA UA BL PCM 材料 内 的 金 
属 材料 的 比例 大 小 被 认为 是 PCM 材料 的 两 个 设计 参数 。 在 这 些 参数 的 可 行 范围 
内 ， 材 料 的 导热 系数 在 20 ~106W/m . K 之 间 变 化 。 使 用 PCM 改善 型 散热 器 ， 
利用 系统 的 热 仿真 ， 得 到 了 芯片 温度 超过 安全 极限 温度 所 花费 的 时 间 。 虽 然 较 高 
的 热传导 系数 似乎 一 直 是 优秀 的 解决 方案 ， 其 导致 在 相同 的 工作 负载 下 芯片 持续 
高 温 的 时 间 更 短 ， 但 是 材料 厚度 对 热 响应 具有 显著 的 影响 。 尽 管 认 为 更 厚 的 材料 
可 以 吸收 更 多 的 热量 ,但 是 PCM 材料 熔化 后 ， 其 温度 似乎 维持 在 更 高 的 水 平 ， 
时 间 也 更 长 。 因 此 ， 考 虑 到 预料 的 温度 范围 ， 该 分 析 注意 到 了 进行 合适 的 热管 理 
设计 和 系统 优化 。 

针对 基于 PCM 材料 的 散热 器 ， 另 一 项 研究 同时 结合 了 CFD 建 模 和 设计 优 
ME) 。 该 项 研究 表明 ， 增 加 的 输入 功率 加 快 了 PCM 材料 的 熔化 速率 ， 从 它们 
综合 热传导 的 角度 分 析 影 响 了 PCM 材料 和 散热 器 之 间 的 协同 ， 直 到 PCM 材料 完 
全 熔化 。 该 分 析 证 明 ， 基 于 PCM 材料 的 散热 器 可 以 高 度 有 效 地 缓解 间歇 性 峰值 
功率 带 来 的 影响 。 
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研究 人 员 已 经 提出 了 用 于 寻 
机 的 冷却 系统 [150] ， 


F 持 设备 和 填充 有 PCM 热 存储 单元 的 可 穿戴 计算 
分 析 了 热 存 储 单元 相对 于 移动 设备 内 部 芯片 的 相对 位 置 和 方 


向 ， 以 确定 冷却 方案 的 最 高 效率 工作 点 。 相 关 研 究 也 分 析 了 PCM 散热 器 的 设计 
参数 ， 并 得 出 了 散热 器 的 最 佳 翅 片 数量 、 热 源 相 对 于 散热 器 的 方向 ， 以 及 可 以 被 
散热 方案 冷却 的 功率 范围 055!1 。PCM 材料 的 另 一 种 用 途 在 “计算 冲刺 ”应 用 中 
得 到 了 验证 ， 这 里 的 “冲刺 ”是 指 人 允许 系统 短 时 间 内 超过 其 热 设 计 功 耗 (TDP) 


以 提供 瞬时 的 高 性 能 M3] 。 通 过 这 种 方式 ， 智 能 手机 中 的 单 核心 芯片 〈 由 于 其 温 


度 原因 功 耗 需要 控制 在 1W 以 内 ) 可 以 被 16 核心 的 芯片 蔡 代 ， 其 所 有 的 16 个 核 
心 允 许 在 短 时 间 内 超过 其 热 设 计 功 耗 ， 以 享受 性 能 显著 提升 带 来 的 好 处 ， 同 时 芯 


片 仍然 可 以 稳定 地 工作 在 其 原 有 的 1W 热 设 计 功 耗 内 。 
基于 PCM 的 材料 已 经 被 广泛 用 于 商业 用 途 。 它 们 很 可 能 被 用 于 未 来 某 些 


CPU 的 冷却 ， 这 些 CPU 具有 很 大 的 热 应 力 ， 其 成 本 相对 较 高 (和 铜 散热 需 相 


E) 也 是 合理 的 。 从 移动 计算 领域 的 大 量 研究 中 也 可 以 看 4H 


地 用 于 皮肤 温度 管理 ， 以 及 坊 片 温度 的 控制 等 用 途 将 继续 不 断 地 开发 。 
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系统 层 、 超 级 计算 机 以 及 数据 
中 心 层 热 事 件 的 缓解 措施 


计算 系统 中 的 热量 来 源 于 有 源 器 件 的 功率 消耗 以 及 处 理 器 和 存储 器 忆 片 内 部 
互联 所 产生 的 焦耳 热 。 温 度 监控 和 缓解 措施 的 发 展演 进 根植 于 热源 的 物理 载体 ， 
因此 ， 将 温度 传 感 絮 般 入 到 芯片 之 中 ， 并 在 心 片 和 封装 层级 上 管理 芯片 功 耗 的 三 
个 主要 决定 因素 〈 即 工作 电压 、 时 钟 频 率 、 和 活动 量 ) 已 被 视 为 热管 理 的 最 直 
接 方式 。 从 那 以 后 ， 其 应 用 领域 一 直 在 增长 。 冷 却 解决 方案 也 是 从 有 源 设备 的 最 
近 处 开始 ， 采 用 散热 器 与 发 热 芯片 核心 直接 物理 接触 。 类 似 地 ， 它 们 也 朝 着 计算 
堆 登 的 更 高 层 发 展 。 

存在 一 些 有 趣 的 相似 之 处 ， 很 多 适用 于 宏观 尺度 的 方法 ， 目 前 已 经 应 用 于 微 
米 和 纳米 尺度 。 受 其 批量 版 本 和 离散 版 本 的 启发 , 已 经 设计 出 了 监控 和 冷却 六 
置 ， 并 发 现 一 些 新 颖 的 实例 ， 比 如 集成 化 设备 〈 如 3D IC 芯片 内 堆 县 层 之 间 、 光 
刻 图 案 ) 和 小 型 化 设备 (如 薄膜 、 纳 米 工 程 材料 ) 。 相 反 ， 通 过 性 能 钳制 来 调节 
设备 的 功 耗 和 热量 输出 的 基本 方法 已 经 从 运算 底层 的 芯片 迁移 到 了 计算 堆 秋 的 更 
高 屋 ， 包 括 内 存 子 系统 、 通 信和 网 络 系统 、 以 及 1/0 层 。 

在 本 章 中 ， 将 讨论 设备 系统 级 以 及 运算 堆 铸 更 高 层 中 用 于 减轻 计算 系统 热 输 
出 的 主要 方法 。 首 先 ， 基 于 近期 各 种 方法 ， 将 描述 操作 系统 (OS) 在 协调 热管 
理 中 所 起 到 的 作用 。 接 下 来 ， 将 讨论 更 大 规模 的 系统 ， 包 括 数据 中 心 和 超级 计算 
机 系统 的 热 事 件 缓解 措施 。 


5.1 OS 层 的 散热 缓解 措施 


设备 的 操作 系统 决定 工作 任务 的 调度 ， 所 以 会 直接 影响 硬件 系统 的 活动 。 在 
大 多 数 商 用 设备 系统 中 ， 主 要 分 三 个 层次 来 协调 功 耗 和 热管 理 之 间 的 关系 : 硬件 
层 (CPU), 、 软 件 驱 动 必 和 操作 系统 层 。 在 大 多 数 系统 中 使 用 行业 标准 ACPI 将 
言 息 从 硬件 层 传递 到 系统 层 ， 并 将 控制 信号 从 系统 层 传递 给 硬件 层 。 此 外 ， 在 执 
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行 功 耗 和 热管 理 策略 的 不 同 硬件 架构 中 ， 有 具体 的 策略 执行 和 数据 展现 之 间 的 差异 
在 该 接口 层 内 通过 适当 地 为 软件 驱动 程序 和 操作 系统 进行 策略 转换 来 解决 。 可 以 
使 用 英特尔 处 理 器 作为 示例 来 举例 说 明 该 层次 结构 。 在 抽象 层 的 最 高 层 ， 全 局 系 
统 状态 (Global System States) 用 于 说 明 系 统 的 运行 模式 ， 比 如 处 于 活动 状态 、 
冬眠 状态 、 掉 电 状 态 或 者 关机 状态 。 这 些 全 局 系统 状态 可 以 进一步 分 为 C 状态 ， 
(也 可 以 称 之 为 处 理 需 电源 状态 ) 。 该 状态 为 处 理 需 的 全 局 活动 状态 和 全 局 睡眠 
状态 提供 了 多 个 子 状态 。 比 如 ， 全 局 活动 状态 分 为 四 个 与 电源 相关 的 C 状态 ， 
诸如 功率 消耗 最 高 、 完 全 活动 状态 CO0、 空 闲 状 态 C1， 以 及 其 他 的 低 功 耗 状 态 ， 
该 状态 可 以 通过 延长 延迟 时 间 以 恢复 到 C0 状态 。C0 状态 又 被 称 之 为 处 理 器 的 性 
能 状态 (P - States)， 该 状态 有 多 个 子 状态 。 这 些 状态 对 应 于 硬件 的 不 同 工 作 
点 ， 由 具体 的 工作 电压 和 工作 频率 决定 。 

ACPI 建立 了 主要 的 代表 权 和 数据 结构 ， 使 得 系统 软件 能 够 追踪 硬件 系 
统 的 工作 状态 和 从 事 的 具体 活动 。 然 而 ，C 状态 和 了 状态 可 以 通过 硬件 系统 
基于 不 同 的 具体 策略 模型 来 实现 。BIOS 和 软件 驱动 程序 负责 必要 的 翻译 ， 
以 便于 ACPI 和 底层 人 硬件 策略 之 间 的 无 缝 协调。 相关 系统 组 件 的 曾 述 说 明 如 
图 5. 1 所 示 。 


un 


操作 系统 


控制 器 
发 电机 


图 5.1 影响 和 /或 管理 热 响应 的 组 件 之 间 关 系 的 系统 视图 


使 用 定义 明确 且 被 广泛 接受 的 ACPI 框架 ， 大 多 数 系统 可 以 执行 动态 热 监 控 
和 热管 理 。 在 第 2 章 中 讨论 了 用 于 系统 性 能 钳制 的 、 由 硬件 系统 执行 的 各 种 感 测 
方法 和 策略 。 在 本 章 中 ， 我 们 将 关注 在 操作 系统 层 以 及 更 高 层 中 适用 的 热管 理 策 
略 和 预防 措施 。 

关于 热 事件 和 操作 系统 在 其 发 展 中 的 影响 作用 ， 一 个 重要 的 发 现 是 ， 心 片 温 
度 的 上 升 和 下 降 所 花费 的 时 间 通 常 比 操作 系统 进行 决策 所 花费 的 时 间 间 隔 要 长 。 
这 个 时 间 取 决 于 硬件 系统 的 热 物 性 〈 热 阻 和 热 容 ) ， 该 热 物 性 又 是 硬件 系统 使 用 
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的 材料 以 及 每 种 类 型 材料 尺寸 大 小 的 函数 。 据 报道 ， 对 于 很 多 现代 硬件 架构 来 
说 ， 虽 然 在 某 些 情况 下 ， 操 作 系统 决策 所 需要 的 时 间 在 10ms 左右 ' 中 ,但 是 这 个 
时 间 间 隔 通常 在 百 毫 秒 的 数量 级 。 例 如 ， 对 于 类 似 Power4 的 架构 ， 据 报道 ， 其 
热 时 间 常 数 大 约 为 20msi2] 。 另 一 方面 ， 操 作 系统 的 调度 器 和 调控 器 模块 ， 其 采 
样 速率 在 毫秒 范围 内 。 因 此 ， 操 作 系统 可 以 有 相对 较 长 的 时 间 评 估 设 备 的 热 状 
态 ， 从 而 对 未 来 进行 预测 ， 并 执行 高 层级 的 决策 以 在 较 长 时 间 范 围 内 影响 系统 的 
热 啊 应 。 为 此 ， 关 于 操作 系统 的 管理 措施 ， 人 们 已 经 进行 了 各 种 优化 。 下 面 将 讨 
论 这 些 热管 理 措施 。 


5.1.1 热 感知 技术 优化 


0S 层 的 热管 理 措施 主要 集中 在 三 个 方面 : 线程 的 分 配 与 迁移 、 任 务 分 配 与 
调度 和 功 耗 管理 。 
5.1.1.1. 线程 分 配 与 迁移 

线程 迁移 技术 最 初 用 于 系统 性 能 和 负载 均衡 的 优化 ， 后 来 发 现 其 在 多 核心 处 
理 器 的 功 耗 与 热管 理 方面 也 可 使 用 。 此 外 ， 通 过 动态 地 匹配 系统 负载 与 最 佳 处 理 
需 核 心 之 间 的 变化 关系 ,来 开发 利用 异 构 多 核心 芯片 。 操 作 系统 负责 安排 处 理 需 
核心 的 运行 队列 ， 并 将 架构 状态 和 数据 从 一 个 核心 传输 到 目标 核心 。 

PUN, Solaris OS 采用 线程 分 配方 法 寻求 利用 “数据 本 地 性 ”的 机 会 ， 并 
且 只 有 当 负 载 分 布 明 显 不 均衡 时 才 执 行 线程 动态 迁移 31。 对 于 每 一 个 即将 执 
行 的 线程 ， 此 机 制 首 先 评估 从 上 一 个 相同 的 线程 分 配给 CPU 开始 到 该 线程 被 
执行 所 经 过 的 时 间 长 度 。 如 果 该 时 间 段 还 未 过 期 ， 则 将 该 线程 分 配给 上 次 执行 
线程 的 同一 个 CPU， 这 样 该 线程 则 有 希望 可 以 利用 CPU 中 缓存 的 数据 。 如 果 
该 时 间 段 已 经 过 期 ， 那 么 该 线程 从 CPU 本 地 数据 中 获 益 的 机 会 会 降低 ， 并 且 
该 线程 将 被 分 配给 当前 运行 最 低 优先 级 线程 的 CPU 。 该 方法 还 保持 线程 的 分 层 
分 组 ， 其 中 每 个 线程 属于 一 个 本 地 组 Igroups， 并 且 根 据 其 距离 长 短 对 其 他 组 
进行 排序 分 层 。 除 了 在 分 配 时间 点 运用 此 方法 之 外 ， 还 可 调用 动态 迁移 以 均衡 
等 待 在 CPU 运行 队列 中 的 线程 数 ， 其 中 首先 均衡 不 同 物理 CPU 芯片 中 排队 的 
线程 数量 。 这 意味 着 ， 该 方法 不 希望 某 一 个 必 片 中 所 有 的 核心 都 承载 计算 任务 
(即使 计算 负载 已 经 得 到 均衡 ) ， 而 另 一 个 芯片 的 核心 却 处 于 空 亲 状态。 相反， 
该 方法 更 希望 在 分 布 式 计算 机 系统 中 ,不 同 物理 芯片 之 间 负 载 可 以 得 到 均匀 
分 布 。 

从 单纯 的 性 能 角度 来 看 ， 大 多 数 OS 的 管理 策略 旨 在 均衡 系统 负载 ， 优 化 所 
有 线程 的 进度 。 因 此 ， 这 些 动态 迁移 的 实施 均 忽 略 了 其 产生 的 热效应 。 
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早期 提出 的 涉及 OS 层面 决策 的 热管 理 方法 之 一 是 热量 以 及 运行 方法 1 。 对 
热 传 播 动 力学 的 观察 启发 了 这 种 管理 多 线程 应 用 的 方法 ， 使 得 可 最 大 限度 地 同时 
激活 核心 器 件 的 线程 组 合 ， 从 而 最 大 限度 地 利用 给 定 核心 的 温度 余 量 ， 然 后 将 计 
算 任务 迁移 到 另 一 个 目标 线程 。 其 主要 的 理论 依据 是 ， 无 论 是 由 于 增多 的 任务 量 
而 造成 核心 的 局 部 区 域 过 热 还 是 大 部 分 子 组 件 出 现 热点 ,冷却 核心 的 峰值 温度 所 
需要 的 时 间 是 恒定 的 。 因 为 芯片 的 大 多 数 热量 通过 朝向 散热 器 的 垂直 导热 路 径 散 
掉 ， 横 向 散热 作用 很 小 ， 并 且 核 心 内 的 所 有 区 域 都 可 以 同时 散热 。 因 此 ，0S 层 
的 热 感知 体系 将 线程 分 配给 芯片 的 各 个 核心 ， 使 得 在 给 定 的 线程 组 合 中 存在 某 些 
线程 利用 核心 中 的 不 同 组 件 (例如 ， 具 有 人 免费 使 用 寄存 器 文件 和 发 布 队 列 的 浮 
点 和 整数 线程 ) 。 这 种 线程 分 配方 法 通过 线程 迁移 方案 进行 了 扩充 ， 实 时 监控 器 
件 核 心 的 温度 传感器 以 探测 核心 何 时 接近 其 最 高 温度 。 根 据 这 个 迁移 触发 机 制 ， 
该 迁移 方案 将 线程 从 某 一 个 温度 高 的 核心 迁移 到 具有 最 小 热 耦合 的 另 一 个 核心 ， 
并 保持 整个 芯片 发 热 的 均匀 分 布 。 线 程 迁移 方案 热 感知 有 效 性 的 一 个 重要 参数 是 
核心 内 部 温度 传感器 的 反应 时 间 。 对 于 这 种 特定 的 方法 ， 温 度 传感器 预计 将 花费 
几 微 秒 的 时 间 来 监测 和 报告 温度 。 在 各 种 替代 方案 中 ， 该 方案 能 够 识别 出 容易 产 
生 热 点 的 特定 资源 ， 并 旨 在 对 这 些 具有 受 限 总 利用 率 的 资源 线程 进行 分 组 ， 以 避 
免 产 生 热 点 ， 实 现 最 佳 的 性 能 。 

基于 PowerS 双核 心 处 理 器 的 开发 经 验 ， 人 们 已 经 提出 了 热 均衡 器 方 法 上 4 。 
虽然 Linux 系统 中 默认 的 负载 均衡 方案 只 有 在 两 个 处 理 器 的 任务 队列 之 间 出 现 显 
著 偏 斜 时 才 会 进行 干预 ， 但 是 该 负载 均衡 方案 会 将 具有 高 预测 活动 量 的 任务 从 过 
热 核心 迁移 到 温度 较 低 的 核心 ， 即 使 从 计算 负荷 角度 来 看 处 理 器 的 任务 队列 也 完 
全 均衡 。 

有 关 线程 迁 移 的 一 个 重要 参数 是 迁移 频率 。 虽 然 围绕 多 核心 芯片 进行 任务 量 
的 再 分 配 有 助 于 芯片 本 身 均匀 地 分 布 发 热量 和 温度 ， 但 是 线程 的 迁移 不 能 频繁 地 
调用 ， 因 为 它 会 导致 不 可 忽略 的 性 能 开销 。 因 此 ， 应 当 追 求 温度 约束 与 性 能 开销 
之 间 的 最 佳 平衡 。 其 中 一 项 研究 调查 了 两 点 之 间 线 程 相互 迁移 的 有 限 范 围 ， 从 而 
最 大 限度 地 减少 迁移 开销 '5] 。 作 为 本 研究 的 一 部 分 ， 同 时 对 降低 功率 密度 和 温 
度 带 来 的 额外 收益 进行 了 量化 研究 。 该 研究 已 经 评估 了 不 同 的 架构 配置 ， 其 中 用 
于 迁移 的 两 个 对 称 点 可 以 是 芯片 核心 的 所 有 资源 中 两 个 确切 的 副本 ， 或 者 它们 可 
以 拆 分 执行 单元 并 且 以 不 同 组 合共 享 其 他 子 结构 〈( 例 如， 寄存 器 文件 、 数 据 绥 
存 、 指 令 缓 存 、 发 布 队列 、 重 命名 表 ) 。 另 一 个 建议 旨 在 研究 一 种 新 颖 的 微 架 
构 ， 该 架构 更 适合 与 辅助 引擎 进行 线程 交换 !6] 。 辅 助 引 擎 的 概念 是 一 种 专门 设 
计 的 结构 ， 用 于 缓冲 线程 的 状态 ， 以 降低 线程 迁移 的 开销 。 大 面积 资源 消耗 在 线 
程 之 间 共 享 ， 对 于 较 小 的 微 核 结构 具有 最 低 程度 的 重复 性 。 整 体 架 构 使 用 两 个 相 
同 的 核心 (主要 核心 和 额外 的 核心 ) ， 当 线程 迁移 由 其 中 一 个 核心 上 的 温度 传 感 
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器 触发 时 ， 计 算 任 务 将 会 迁移 到 温度 较 低 的 核心 ， 直 到 该 计算 任务 将 核心 温度 加 
热 到 临界 阐 值 以 上 ， 并 和 需要 发 生男 一 个 线程 的 迁移 。 

另 一 项 在 温度 约束 条 件 下 针对 线程 迁移 的 研究 是 通过 一 种 更 加 直接 的 方式 解 
决 了 迁移 的 性 能 开销 ， 而 无 须 重 新 设计 芯片 核心 ”] 。 在 一 个 多 核心 芯片 上 运行 
的 线程 总 数 受到 芯片 总 功 耗 的 限制 ， 而 总 功 耗 又 与 温度 相关 。 在 某 个 给 定 的 时 
刻 ， 识 别 最 佳 可 执行 线程 组 合 的 问题 可 以 通过 “温度 公平 (Thermal fairness ) " 
概念 来 表达 。 该 概念 表示 具有 相似 活动 特征 的 线程 应 该 分 配 相近 的 功率 ， 并 且 每 
个 线程 应 当 保证 一 直 具 有 最 低 的 性 能 (最 低 功 耗 ) 。 在 给 定 的 时 间 内 ，0S 决定 
应 该 运行 哪些 线程 ， 以 及 这 些 线程 运行 多 长 时 间 ， 该 想法 就 是 将 上 述 “ 温 度 公 
平 ”概念 艇 入 到 OS 的 优先 级 函数 中 (Priority Function) 。 

在 这 种 情况 下 ， 线 程 迁移 不 是 作为 一 种 解决 方案 直接 帮助 系统 冷却 。 类 似 于 
英特尔 处 理 器 TM 方法 中 使 用 的 方案 。 本 研究 中 是 利用 动态 性 能 钳制 方法 作为 
温度 控制 的 主要 机 制 。 全 局 门 控 时 钟 应 用 于 世 片 核心 的 温度 传感器 ， 并 以 此 来 触 
发 热 应 急事 件 。 热 感知 线程 迁移 的 作用 是 帮助 系统 在 DTM 功能 (主动 热管 理 ) 
被 激活 时 保证 系统 的 性 能 最 大 化 。 有 具体 的 讲 ， 该 功能 是 通过 将 线程 迁移 到 那些 没 
有 达到 “温度 饱和 ”的 核心 来 实现 ， 以 试图 使 大 多 数 芯 片 核心 在 “温度 饱和 ?” 
点 附近 运行 线程 的 时 间 达 到 最 长 。 “温度 饱 和 ”点 定义 为 该 温度 极限 稍微 略 低 于 
温度 传感器 触发 性 能 钳制 动作 时 的 温度 值 ， 该 温度 点 对 应 于 允许 系统 最 高 功率 消 
耗 的 工作 点 ， 而 不 会 由 于 钳制 而 导致 性 能 损失 。 该 方法 将 线程 分 为 两 种 类 型 : 饱 
和 和 去 饱和 。 饱 和 线程 产生 的 发 热量 将 会 在 如 时 间 内 使 得 芯片 温度 超过 其 安全 
温度 浆 值 ， 而 去 饱和 线程 产生 的 热量 将 会 使 芯片 温度 保持 在 其 安全 国 值 以 下 。 对 
于 某 给 定 的 线程 C， 通 过 检查 同时 存在 于 系统 中 的 其 他 线程 ， 来 确定 为 其 分 配 的 
运行 时 间 和 功率 。 如 果 其 他 线程 的 类 型 都 与 线程 C 相似 ， 比 如 其 他 所 有 线程 都 
是 饱和 的 ， 则 线程 C 被 分 配 的 运行 时 间 周 期 将 被 缩减 ; 如 果 其 他 所 有 并 发 线程 
都 是 去 饱和 的 ， 则 线程 C 将 被 分 配 更 多 的 运行 时 间 和 功率 。 

该 项 研究 提出 了 一 种 方法 ， 是 将 迁移 开销 并 人 到 0S 决策 机 制 中 ， 并 对 因 引 
入 软件 层 (Am 0S、 中 间 件 、 通 信 库 ) 而 造成 的 性 能 开销 进行 了 全 面 彻底 的 评 
估 。 该 软件 层 的 引入 使 线程 的 迁移 变 得 更 加 容易 [1 。 因 此 ， 在 温度 均衡 中 因 线 
程 迁移 带 来 的 收益 不 会 被 性 能 开销 所 掩盖 。 在 该 特定 的 研究 中 ， 这 个 问题 更 加 急 
迫 ， 因 为 需要 考虑 流 媒体 应 用 的 MPSoC， 其 中 服务 质量 (QoS) 的 优先 级 最 高 。 
在 MPSoC 中 ， 每 个 独立 处 理 带 的 温度 均衡 都 需要 被 赋予 一 个 “努力 程度 ”的 概 
念 。 对 于 每 个 处 理 恬 ,该 “努力 程度 ”的 定义 是 指 在 某 个 指定 的 平均 温度 值 附 
近 的 温度 区 间 。 其 基本 原理 为 ， 如 果 热 感知 负载 均衡 右 能 够 确保 将 每 个 处 理 带 的 
温度 保持 在 该 区 间 范 围 内 ， 则 整个 系统 将 实现 温度 均衡 。 利 用 芯片 内 部 温度 传 感 
器 的 温度 反馈 ， 当 处 理 器 的 温度 达到 温度 区 间 的 上 限 或 者 下 限时 ， 即 会 触发 线程 
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迁移 。 在 这 些 情况 下 ， 任 务 分 别 被 迁移 走 (任务 被 迁移 到 温度 处 于 其 温度 区 间 
下 限 的 处 理 器 ) 或 者 被 迁移 到 (任务 来 自 温 度 位 于 其 温度 区 间 上 限 的 处 理 器 ) 
该 处 理 需 的 运行 队列 中 。 对 于 每 一 个 迁移 动作 ， 同 时 考虑 到 处 理 器 的 热 状 态 ， 根 
据 一 系列 的 标准 来 选择 一 个 源 或 者 一 个 单独 的 目标 处 理 器 。 下 一 步 的 工作 即 为 确 
定 从 一 个 源 处 理 咒 到 一 个 目标 处 理 需 需要 迁移 的 任务 负载 量 。 假 设 任务 负载 可 以 
在 这 两 个 处 理 器 之 间 以 与 它们 两 者 之 间 的 初始 温度 差 成 正比 的 频率 来 回迁 移 ， 直 
到 它们 之 间 达 到 任务 负载 的 均衡 。 对 迁移 成 本 的 动态 评估 考虑 了 这 一 频率 ， 对 于 
一 组 任务 负载 由 需要 传输 的 数据 量 来 确定 。 该 温度 均衡 迁移 方案 的 具体 实现 可 根 
据 给 定 软 件 基 础 架构 的 迁移 开销 的 影响 和 给 定 应 用 程序 的 QoS 衡量 指标 的 可 容 
和 忍 误差 来 构建 其 迁移 成 本 函 数 。 

新 兴 技 术 应 用 的 线程 迁移 方案 也 受到 了 大 家 的 注意 。 一 种 建议 是 针对 堆 丢 
DRAM IC 核心 进行 热管 理 ， 将 线程 迁移 方案 集成 到 OS. 上 下 文 切换 机 制 中 [9] 。 
所 提出 的 方案 之 一 是 以 10ms 为 一 个 固定 周期 ， 以 循环 的 方式 在 各 核心 之 间 轮 换 
交替 线程 。 另 一 种 方案 是 利用 温度 传感器 的 反馈 在 温度 最 高 核心 和 温度 最 低 核 心 
之 间 交 换 任务 ， 假 设 这 两 个 核心 之 间 的 温度 差 大 于 预先 设 定 的 阔 值 。 

一 项 更 加 全 面 的 研究 讲述 了 商用 处 理 需 芯片 的 详细 温度 测量 ， 特 别 强调 了 不 
同 核心 之 间 以 及 核心 自身 内 部 的 温度 变化 [81 。 不 同 核心 之 间 的 切换 ， 即 核心 之 
间 任 务 量 的 迁移 ， 已 经 作为 热管 理 手 段 被 人 们 分 析 研 究 。 有 人 认为 ， 底 层 人 硬件 的 
热 特性 应 该 指导 OS 层 的 线程 迁移 以 及 对 迁移 策略 进行 调度 。 通 过 为 更 高 温度 和 
更 低温 度 的 芯片 核心 设置 非 对 称 的 温度 区 间 ， 预 防 性 的 任务 迁移 已 经 被 证 明 是 有 
效 的 。 

最 新 的 任务 迁移 方法 强调 了 在 物理 空间 上 与 邻近 芯片 核心 相关 的 核心 其 工作 
负载 的 重新 分 配 上 1 ， 当 温度 传感器 报告 其 核心 温度 超过 设 定 阔 值 时 ， 便 触发 迁 
移动 作 。 目 前 ， 为 了 线程 迁移 而 在 目标 芯片 核心 的 选择 方面 ， 考 虑 了 目标 核心 因 
增加 任务 量 而 对 邻近 核心 产生 的 温度 影响 。 

最 后 ， 我 们 注意 到 ， 线 程 的 分 配 与 迁移 也 可 以 由 硬件 机 制 来 完成 。 然 而 ， 我 
们 不 会 详细 阐述 基于 硬件 的 方案 ， 因 为 它们 不 在 本 章 的 讨论 范围 内 [1?]1。 
5.1.1.2 OS 层 的 预测 性 热管 理 

OS 层 的 热管 理 主要 分 为 两 种 类 型 : 被 动 反 应 式 和 主动 预测 式 。 被 动 反应 式 
热管 理 只 利用 芯片 内 部 的 温度 传 感 需 的 反馈 ， 例 如 前 面 讨论 的 线程 迁移 方案 。 主 
动 预测 式 热 管理 也 可 以 利用 温度 传感器 的 反馈 ， 但 是 它们 经 常 将 温度 信息 和 其 他 
性 能 指示 器 (例如 ， 人 性 能 计数 器 、 系 统 状 态 ) 结合 在 一 起 来 预测 未 来 的 系统 热 
状态 ， 并 执行 预防 性 措施 以 避免 热 应 急 情 况 的 发 生 和 系统 性 能 被 钳制 。 这 些 热 管 
理 方案 对 芯片 核心 的 峰值 温度 使 用 预测 器 进行 预测 ， 并 利用 该 预测 信息 来 执行 
OS 策略。 下 面 将 介绍 利用 预测 方案 均衡 系统 负载 和 线程 迁移 的 现 有 方法 。 
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已 经 提出 了 一 种 HY 型 预测 器 ， 用 于 把 反映 特定 应 用 程序 特征 和 特定 芯片 核 
心 特征 的 热 模型 结合 在 一 起 "1 。 基 于 该 预测 器 的 反馈 ， 操 作 系 统 执行 线程 的 迁 
移 ， 把 计算 任务 从 预测 温度 最 高 的 核心 迁移 到 温度 最 低 的 核心 。 此 外 ， 通 过 调整 
优先 级 顺序 来 调节 芯片 的 资源 以 控制 芯片 的 功率 密度 。 这 种 新 的 OS SRI CS ZR 
入 进 了 英特尔 四 核 处 理 器 上 运行 的 Linux 系统 中 。 预 测 器 反映 特定 应 用 程序 的 分 
量 旨 在 捕获 伴随 着 系统 应 用 程序 的 波动 在 较 短 时 间 间 隔 内 系统 热 响 应 的 变化 。 
RLSM 已 被 用 于 生成 回归 模型 以 预测 反映 特定 应 用 特征 的 温度 。 该 回归 模型 本 质 


上 是 将 一 组 系统 参数 与 系统 输出 (本 示例 中 系统 输出 为 温度 ) 相关 联 ， 其 具有 
如 下 的 线性 表达 式 : 
y =Q U +AU t: tO, (5.1) 


AP, u=[u, 0, u] 是 用 于 回归 模型 的 一 组 向 量 ， 该 回 量 以 输入 向 量 的 形式 
表示 系统 参数 。 例 如 ， 输 入 向 量 可 以 包括 指令 数量 、 温 度 读 值 以 及 缓存 缺失 ， 并 
且 观 察 到 的 输出 是 采样 间隔 结束 时 的 温度 。 需 要 从 一 组 给 定 的 输入 向 量 和 系统 输 
出 估算 出 参数 a, ，…，a 以 构建 模型 。 基 于 到 第 个 间隔 为 止 所 得 到 的 输入 和 
输出 ， 以 及 基于 先前 间隔 佑 算出 的 系数 值 ， 使 用 a 参数 估算 器 来 得 出 每 一 个 k +1 
预测 间隔 的 系数 值 。 特 定 核 心 的 温度 预测 是 基于 温度 的 一 个 计算 模型 ， 该 模型 把 
温度 变化 率 和 一 个 恒定 系数 与 当前 温度 与 稳 态 温度 之 间 的 温度 差 关 联 起 来 ， 该 一 
阶 微分 方程 在 1=0 时 的 环境 温度 和 := oo 时 的 稳 态 温度 条 件 下 求解 。 恒 定 系数 是 
在 100% 工作 负载 下 基于 给 定 处 理 器 的 加 热 和 冷却 速率 ， 可 根据 经 验 得 到 。 对 该 
热 模型 进行 离线 计算 ， 可 以 得 出 100% 利用 率 条 件 下 的 稳 态 温度 。 由 此 产生 的 特 
定 核 心 的 温度 预测 顺 模 型 如 下 ; 

T(t) = Tsicaqysiate — ( TsteadyStare ~ TAmp ) € 3 (5.2) 

在 预测 间隔 的 开始 ， 使 用 反映 特定 应 用 程序 和 特定 芯片 核心 的 预测 器 加 权 和 
SEF TE | THM AS i A EERME Linux 调度 程序 中 。 挝 移动 作 由 两 个 步骤 组 
成 ， 首 先 使 用 反映 特定 芯片 核心 的 预测 器 来 预测 更 远 未 来 时 间 内 的 温度 。 如 果 这 
个 预测 结果 超过 了 预先 设 定 的 触发 国 值 门 限 ， 则 反映 特定 应 用 程序 的 短期 预测 器 
将 预测 较 近 未 来 时 间 内 的 温度 ， 同 时 一 旦 预测 结果 超过 第 二 个 浆 值 门限 ， 则 迁移 
将 会 开始 ， 并 证 明了 迁移 开销 的 合理 性 。 

另 一 个 流行 的 预测 工具 是 ARMA 方法 。 提 出 一 种 方法 在 预测 热 应 急事 件 时 
主动 分 配 工作 负载 并 旨 在 避免 该 事件 的 发 生 ， 这 种 方法 的 开发 使 用 了 ARMA 模 
型 4 。 此 外 ， 该 方法 通过 动态 适应 性 来 增强 自身 的 性 能 ， 使 其 可 以 感知 工作 负 
载 特性 的 变化 ， 并 且 可 以 在 运行 时 更 新 预测 器 ， 最 终 的 目标 是 使 用 预测 器 迁 移 任 
务 ， 从 而 均衡 多 核 芯 片 中 的 温度 分 布 。 

ARMA 模型 获取 的 离散 时 间 序 列 值 为 x,。 在 该 模型 中 ,假设 时 刻 t 处 的 值 x, 
通过 AR 系数 a 与 序列 中 的 p 个 过 去 值 相关 ,并且 通过 移动 平均 系数 4 与 9 个 白 
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噪声 误差 项 相关 联 。 这 个 模型 被 称 作 阶 数 (p, q), ， 通 常 表示 为 


XX = Sara + EN (5.3) 
DENN vel 
假设 噪声 项 (也 被 称 为 残 差 ) 与 正 态 
随机 分 布 非 相 关 , e, ~N (0, 0o?)。 
生成 ARMA 模型 的 过 程 如 图 5.2 所 示 。 
工作 负载 分 配方 案 使 用 特定 的 方法 来 实现 如 
下 这 些 步骤 15] 。 


EA 、 . a 如 果 拟 合 结果 的 
通常 来 讲 ， 人 们 希望 通过 最 小 可 能 的 p e 
则 增加 阶 数 


和 g 生成 具有 可 接受 精度 的 模型 ， 利 用 该 指 
导 方 法 已 经 完成 了 模型 的 创建 。 从 最 小 的 模 
型 (p=g=1) 开始 ,并 且 使 用 流行 的 最 小 
二 乘法 进行 初始 拟 合 ， 然 后 评估 所 得 到 的 拟 
合 精度 ， 逐 渐 增 加 阶 数 直到 拟 合 精度 满足 要 
求 。 可 以 利用 不 同方 法 评估 拟 合 的 预期 精 
度 ， 例 如， 回归 函数 的 输入 与 输出 之 间 关 联 。 图 5.2 Æ ARMA 模型 的 流程 图 
因子 的 二 次 方 有 助 于 解释 水 数 输出 的 变化 量 

大 小 ， 该 变化 量 可 直接 归 因 于 最 小 二 乘 回归 的 变化 。 在 这 个 具体 研究 中 ， 拟 合 的 
可 用 性 可 以 通过 一 种 变通 的 方法 来 衡量 ， 该 方法 利用 了 “最 终 预测 误差 ”的 概 
念 。 该 “最 终 预测 误差 ”将 拟 合 的 可 用 性 和 模型 中 时 间 序 列 的 大 小 (N) 、AR- 
MA 模型 的 阶 数 (n =p +qg) ， 以 及 噪声 项 (V) 关联 起 来 ， 如 下 式 所 示 : 


pes 
最 终 预 测 误差 = XY (5.4) 
l -W 


执行 迭代 循环 ， 直 到 “最 终 预测 误差 ”下 降 到 阔 值 以 下 ， 如 图 5. 2 所 示 。 

在 过 程 的 最 后 一 步 ， 验 证 ARMA 模型 的 最 终 属性 ， 其 为 随机 分 布 的 噪声 项 
的 假设 。 这 种 特定 的 建 模 方法 使 用 自 相关 函数 来 实现 ,该 函数 可 以 用 来 验证 在 真 
正 随机 分 布 的 噪声 项 中 ， 自 相关 接近 于 零 。 在 本 研究 中 定义 了 有 限 的 置信 区 间 ， 
如 果 大 多 数 噪声 序列 的 自 相 关 因 子 落 在 该 区 间 ， 则 ARMA 模型 即 可 通过 验证 。 

利用 该 过 程 ， 通 过 温度 测量 可 以 得 出 适用 于 心 片 核心 温度 的 预测 豆 ， 该 测量 
的 温度 作为 观察 到 的 数据 迹 线 。 在 多 核心 芯片 中 ， 为 每 个 单独 核心 生成 一 个 预测 
器 以 便 获 取 每 个 单独 核心 的 热 行为 ， 通 过 在 线 自 适应 性 起 到 对 温度 预测 方法 的 改 
善 。 由 于 系统 的 工作 负载 一 直 在 变化 ， 这 种 自 适 应 方法 的 引入 是 非常 有 必要 的 。 
因此 ， 系 统 的 温度 时 间 序 列 仅 在 特定 的 负载 阶段 内 是 保持 静止 的 ， 而 不 同 负载 阶 
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段 的 热 行为 可 能 在 很 大 程度 上 偏离 用 于 训练 ARMA 模型 的 数据 。 对 于 所 有 可 能 
的 工作 负载 阶段 ， 构 建 和 训练 ARMA 模型 将 产生 大 量 的 开销 。 为 了 缓解 这 个 问 
题 ， 提 出 了 ARMA 模型 的 持续 验证 (4 。 该 在 线 验 证 过 程 包括 检测 噪声 项 是 否 偏 
离 分 布 ， 该 分 布 在 模型 训练 阶段 已 得 到 表征 ， 使 用 统计 工具 来 量化 噪声 项 的 平均 
值 与 零 之 间 的 偏差 幅度 。 适 用 数据 训练 中 噪声 项 的 方差 作为 参考 ， 应 用 该 偏差 的 
闵 值 ， 其 大 小 约 为 3 VY。 在 检测 到 该 偏差 时 ， 系 统 运 行 计 算出 新 的 ARMA 模型 。 

作为 同一 研究 的 一 部 分 ， 已 经 评估 了 其 他 替代 性 的 预测 需 ， 比 如 指数 平均 预 
测 器 、 类 似 于 分 支 预测 器 的 历史 预测 器 ， 以 及 递归 最 小 二 乘 预 测 器 。Solaris QS 
(动态 负载 均衡 ) 中 的 默认 策略 机 制 因为 使 用 了 这 些 预测 器 而 得 到 了 增强 。 
ARMA 模 型 使 用 每 个 核心 的 温度 传感器 报告 的 温度 ， 预 测 器 被 用 来 贯彻 执行 主动 
迁移 策略 ， 其 用 来 识别 出 未 来 预测 温度 会 升 高 的 CPU， 并 将 线程 从 CPU 中 迁移 
走 。 此 外 ， 使 用 温度 预测 需 来 动态 的 修改 任务 的 分 配方 案 。 最 初 ， 使 用 前 面 描述 
的 数据 本 地 性 原理 对 任务 进行 分 配 ， 然 后 在 每 个 任务 分 配 决 策 时 段 ， 如 果 某 个 核 
心 被 识别 出 在 下 一 个 时 段 温度 可 能 会 升 高 ， 则 线程 即 会 从 其 运行 的 队列 中 迁移 到 
备用 的 核心 。 与 迁移 正在 和 运行 的 线程 相 比 ， 迁 移 待 运行 的 线程 是 一 种 更 具有 经 济 
效益 的 策略 ， 因 为 迁移 正在 运行 的 线程 将 产生 性 能 的 损失 。 此 外 ， 一 般 情 况 下 ， 
为 了 控制 性 能 损失 ， 线 程 迁移 的 数量 会 受到 限制 。 
5.1.1.3 任务 的 分 配 与 调度 

OS 做 出 的 影响 温度 分 布 的 男 一 个 关键 决定 是 任务 的 分 配 与 调度 。 由 于 该 种 
情况 涉及 所 有 的 设计 和 运行 ， 在 过 程 的 早期 阶段 做 出 的 规划 决策 对 系统 具有 最 
大 、 最 广泛 的 影响 。 同 样 的 原因 ，0S 层 的 决定 都 至 关 重要 。0S 可 以 访问 各 种 关 
于 任务 的 信息 ， 比 如 截止 时 间 、 用 户 端 对 系统 响应 的 期 望 、 内 存 访 问 模式 、 数 据 
类 型 ， 以 及 VO 特性 。 从 这 个 意义 上 讲 ，0S 能 够 做 出 更 具 影 响 力 和 更 明智 的 
决策 。 

现代 OS 调度 带 在 其 决策 机 制 中 优先 考虑 任务 分 配 的 公平 性 ， 每 个 任务 允许 
使 用 处 理 器 的 时 间 长 度 保持 平衡 。 例 如 ， 在 Linux 2.6 操作 系统 中 ， 每 个 任务 都 
与 一 个 虚拟 的 时 间 相 关 。 每 个 任务 的 优先 级 均 与 “衰减 因子 ”关联 在 一 起 ,“ 豪 
减 因子 ”持续 不 断 地 衡量 每 个 任务 允许 使 用 处 理 需 的 时 间 。 与 较 高 优先 级 的 任 
务 相 比 ， 较 低 优 先 级 的 任务 具有 较 大 的 “衰减 因子 ”。 根 据 每 项 任务 拥有 的 虚拟 
时 间 长 度 ， 通 过 时 间 排 序 的 “ 红 黑 树 ” 维 护 准备 运行 的 任务 。 遵 循 公平 的 原则 ， 
具有 最 短 虚拟 时 间 长 度 的 任务 首先 被 挑选 出 来 ， 以 便于 安排 下 一 个 准备 运行 的 任 
Fo KAWY, 单纯 地 从 公平 性 的 角度 来 安排 处 理 器 的 任务 可 能 会 产生 热 的 不 平 
衡 问题 ， 因 为 不 同 的 任务 可 能 会 消耗 不 同 大 小 的 动态 功 耗 ， 以 及 它们 可 能 会 以 不 
平衡 的 方式 激活 人 处理 右 内 的 本 地 执行 单元 。 因 此 ， 各 种 学 术 研 究 已 经 解决 了 在 任 
务 调度 和 分 配 中 实现 “ 热 感 知 (Thermal Awareness)” 的 问题 。 
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针对 任务 调度 对 温度 的 影响 ， 最 早 的 研究 之 一 主要 集中 在 线程 分 配 策略 的 研 
究 ， 以 测试 现 有 策略 的 局 限 性 :1 。 该 研究 在 类 似 Power4 架构 的 处 理 器 上 通过 热 
仿真 方式 完成 ， 对 多 个 分 配 策略 用 10ms 的 决策 时 间 间 隔 进行 了 测试 ， 类 似 于 本 
研究 中 最 新 版 本 的 Linux 操作 系统 中 默认 的 时 间 间 隔 。 在 第 一 个 时 间 片 段 中 运行 
线程 ， 并 且 为 每 个 线程 收集 记录 处 理 器 的 温度 ， 作 为 其 加 热 行为 的 代表 符号 。 该 
研究 发 现 ， 针 对 基准 工作 负载 程序 SPEC2000 中 相同 线程 的 不 同调 用 方式 ， 处 理 
器 峰值 温度 在 5C 以 内 变化 。 因 此 ， 基 于 该 初始 运行 测试 的 结果 ， 认 为 得 出 的 线 
程 热 行为 是 可 靠 的 。 评 估 标 准 是 每 个 线程 调度 策略 可 以 成 功 地 将 芯片 的 温度 维持 
在 安全 浆 值 以 下 ， 本 研究 中 该 安全 闪 值 设 定 为 85$% 。 本 次 测试 验证 的 策略 包括 随 
机 策略 、 平 均 温 度 策略 、 最 高 温度 策略 和 最 低温 度 策略 。 随 机 策略 为 所 有 线程 公 
平地 分 配 优先 级 ， 并 随机 地 选择 下 一 个 线程 进行 调度 。 因 此 ， 随 机 策略 对 芯片 的 
热 感知 完全 不 起 作用 。 事 实 上 ， 随 机 地 选择 线程 有 助 于 降低 芯片 中 关键 执行 单元 
的 峰值 温度 ， 比 如 浮 点 单元 。 这 是 因为 大 量 繁重 地 使 用 该 单元 使 其 温度 升 高 的 浮 
点 线程 可 能 伴随 着 未 使 用 该 单元 的 整数 计算 工作 负载 ， 使 该 单元 的 温度 最 终 达 到 
稳定 。 虽 然 避 免 了 温度 不 受 控 制 的 升 高 ， 但 并 不 能 防止 出 现 高 于 预 设 阔 值 的 高 
温 。 研 究 结果 发 现 ， 芯 片 温度 在 安全 温度 靖 值 之 上 的 时 间 占 整个 芯片 运行 时 间 
的 96% 。 

平均 温度 策略 将 每 个 线程 与 该 时 间 段 内 的 平均 温度 联系 在 一 起 ， 平 均 温 度 通 
过 芯片 运算 得 到 。 在 系统 运行 时 ， 当 芯片 的 温度 超过 设 定 的 温度 阔 值 时 ， 线 程 调 
度 器 对 具有 最 小 平均 温度 的 线程 优先 安排 调度 。 虽 然 这 种 策略 似乎 改善 了 热 响 
应 ， 但 是 在 线程 的 整个 运行 时 间 周 期 内 温度 的 变化 仍然 会 引起 芯片 内 一 些 单元 的 
温度 持续 不 断 的 上 升 。 最 高 温度 策略 旨 在 实现 芯片 的 峰值 性 能 ， 并 按 顺 序 依次 调 
度 具 有 更 高 温度 特性 的 线程 ， 导 致 占线 程 总 运行 时 间 的 98% 的 时 间 里 ， 均 会 触 
及 温度 国 值 门限 。 最 后 ， 最 低温 度 策略 管理 具有 温度 优先 级 的 线程 ， 而 无 论 何 时 
线程 的 温度 超过 温度 阔 值 。 对 于 每 个 决策 时 间 间 隔 ， 首 先 识别 出 处 理 器 中 具有 最 
高 温度 的 单元 块 。 然 后 ， 在 测试 运行 过 程 中 ， 从 线程 队列 中 选择 出 在 该 处 理 器 单 
元 块 上 具有 最 小 温 升 的 线程 ， 以 便 接 下 来 对 该 线程 进行 操作 。 当 芯片 的 温度 低 于 
温度 阔 值 时 ， 调 度 器 恢复 各 线程 之 间 调 度 的 公平 性 ， 并 人 允许 执行 温度 较 高 的 线程 
以 充分 利用 温度 低 于 靖 值 的 时 间 。 在 线程 运行 时 间 的 99% 时 间 段 内 ， 该 策略 成 
功 地 将 峰值 温度 控制 在 温度 阔 值 以 内 。 该 项 研究 有 助 于 证 明 调 度 策略 在 处 理 器 温 
度 分 布 的 形成 和 不 同 策略 之 间 的 变化 程度 方面 的 重要 性 。 此 外 ， 它 还 证 实 了 芯片 
内 置 温度 传感器 在 指导 这 些 策 略 中 的 重要 性 ， 因 为 实际 系统 中 的 每 个 线程 的 温度 
都 需要 从 实际 温度 测量 中 得 到 。 

后 续 研 究 通过 现场 实验 评估 了 下 一 代 Powers 处 理 器 的 架构 ， 并 在 系统 软件 
层 提供 了 “ 热 感知 ”解决 方案 :人 。 这 项 研究 的 动机 是 由 于 观察 到 线程 的 功能 
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元 级 资源 的 使 用 是 其 热 影响 的 强 指标 ， 因 为 未 使 用 的 功能 块 通过 精细 时 钟 门 控 被 
置 于 低 功率 状态 ， 这 将 严重 影响 产生 热点 的 位 置 。 操 作 系 统 对 动态 线程 的 优先 级 
以 及 实时 任务 截止 时 间 的 访问 被 用 来 动态 地 重新 分 配 任务 ， 从 而 使 功率 密度 的 空 
间 变 化 朝向 更 平滑 的 分 布 。Power5 处 理 器 芯片 中 的 24 个 数字 温度 传感器 每 4ms 
采样 一 次 (对 应 于 调度 器 的 时 间 刻 度 ) 以 跟踪 温度 的 变化 。 在 本 研究 中 测试 的 
一 种 方法 是 允许 任务 在 每 个 调度 时 刻 访问 双核 Powers 处 理 需 的 两 个 核心 之 间 的 
切换 开关 ， 这 种 方法 的 特点 是 利用 空间 热 松 弛 ， 而 免费 方法 旨 在 针对 时 间 热 松 
弛 。 当 工作 负载 组 合 表现 出 不 同 程度 的 热 挑 战 时 ， 建 议 使 高 温 线 程 和 低温 线程 随 
时 间 交 替 运 行 ， 以 便 有 更 长 的 时 间 散 热 ， 这 样 就 会 降低 芯片 的 峰值 温度 。 

已 经 提出 了 一 种 “ 热 感知 ”调度 器 旨 在 保留 现 有 OS 的 基本 调度 原理 ， 以 便 
使 Linux 2. 6 系统 可 以 适用 多 核 处 理 器 i!5] o Linux 系统 中 默认 调度 器 的 这 种 以 关 
系 亲 玻 为 调度 目标 可 能 会 导致 线程 在 同一 CPU 上 重复 执行 以 利用 热 缓 存 中 的 数 
据 ， 并 且 钠 载 均衡 器 可 能 不 会 长 时 间 干 预 或 者 根本 不 干预 ,除非 发 现 CPU 的 任 
务 队列 之 中 存在 明显 的 不 平衡 。 这 项 研究 指出 了 该 方案 存在 的 潜在 风险 ， 即 允许 
热 密集 型 任务 重复 使 用 同一 CPU， 从 而 导致 温度 的 急剧 上 升 进而 产生 热点 。 基 
于 众所周知 的 轮 询 算法 ， 开 发 了 “ 热 感知 ”替代 方案 ， 基本 的 轮 询 算法 为 队列 
中 的 每 个 线程 分 配 相等 的 时 间 。 线 程 按 顺序 从 队列 中 被 拉 出 来 ， 并 允许 使 用 它们 
的 运行 时 间 ， 无 论 它们 被 分 配给 哪个 核心 。 该 算法 考虑 到 心 片 的 温度 而 做 了 如 下 
改变 : 系统 使 用 芯片 中 内 置 的 数字 温度 传感器 来 监控 跟踪 世 片 核心 的 温度 ， 当 世 
片 核心 温度 超过 系统 的 安全 温度 闵 值 时 ， 线 程 在 每 个 处 理 器 上 被 安排 运行 相等 比 
例 的 时 间 ， 以 便 在 芯片 的 所 有 核心 上 均匀 地 扩散 热 耗 ， 这 样 有 助 于 降低 最 高 温 核 
心 的 峰值 温度 。 对 于 双核 心 必 片 ， 任 务 在 两 个 核心 之 间 周 期 性 地 迁移 。 对 于 四 核 
心 必 片 ， 任 务 在 四 个 核心 之 间 轮 换 以 便 在 每 个 核心 上 运行 相同 长 度 的 时 间 。 

当 一 件 热 紧急 事件 需要 引起 立即 响应 时 ， 提 出 了 另 一 种 “ 热 感知 ”调度 需 ， 
以 调整 时 间 分 配 的 优先 级 [16] 。 通 过 利用 过 程 中 测试 程序 的 分 析 信息 和 收集 性 能 
计数 需 的 统计 数据 ， 每 个 处 理 过 程 均 与 系统 的 热 强度 相关 联 。 作 为 共享 库 用 途 的 
分 析 器 将 处 理 进 程 的 访问 频率 收集 处 理 器 资源 ， 这 与 处 理 器 的 功 耗 和 功率 密度 相 
关 。 通 过 OS 层 进行 的 热 干 预 发 生 在 以 下 情况 : 当 芯 片 内 置 温度 传感器 发 现 忆捷 
温度 已 经 超过 了 某 个 温度 阔 值 ， 根 据 分 析 数 据 统计 出 具有 高 热 强度 的 进程 ， 并 对 
其 采取 降低 优先 级 的 措施 。 为 了 降低 对 性 能 的 影响 ， 进 程 的 优先 级 是 以 一 定 的 增 
量 逐 步 递 减 的 ， 同 时 也 为 了 热 紧 急事 件 一 旦 消失 后 性 能 能 够 尽快 地 恢复 到 正常 水 
平 。 然 而 ， 该 增 量 需要 设置 得 足够 大 ， 以 便 能 够 覆盖 在 这 个 时 间 点 可 能 出 于 分 配 
的 公平 性 而 出 现 的 任何 均衡 。 因 此 ， 与 温度 较 低 时 的 处 理 进 程 相 比 ， 温 度 较 高 的 
进程 被 分 配 更 短 的 时 间 。 该 基本 原理 的 目的 仍然 是 尽 可 能 地 使 系统 维持 在 接近 满 
负 稚 运行 ， 通过 运行 温度 更 低 的 进程 来 实现 该 目的 。 当 芯片 内 置 温 度 传 感 费 报告 
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的 芯片 温度 已 降 至 临界 阔 值 以 下 时 ， 即 恢复 所 有 进程 的 优先 级 。 另 一 个 极端 情况 
是 ， 进 程 的 优先 级 会 持续 降低 ， 直 到 所 有 被 干预 的 进程 达到 其 可 能 的 最 低 优先 级 
为 止 。 如 果 所 有 的 进程 均 达 到 了 它们 的 最 低 优 先 级 ,但 是 系统 仍然 没有 从 热 紧急 
事态 中 恢复 ， 则 恢复 所 有 进程 的 优先 级 ， 并 重新 创建 新 的 调度 以 试图 寻找 更 优 的 
调度 方案 。 

作为 多 核心 处 理 器 任务 分 配 的 一 部 分 ， 研 究 了 在 满足 一 定 热 约束 条 件 的 同时 
使 系统 任务 的 处 理 量 最 大 化 的 平衡 方案 [7”] 。 研 究 人 员 开发 了 一 种 在 线 任务 分 配 
算法 ,该 算法 可 以 在 Sims 的 决策 时 间 间 隔 内 得 到 执行 。 通 常 Sms 的 时 间 间 隔 对 
于 大 量 处 理 天 核心 的 OS 来 说 是 足够 的 (高 达 128 核心 ) 。 利 用 该 方法 解决 的 问 
题 是 将 多 个 任务 (n) 分 配给 n 个 核心 ， 而 同时 也 决定 它们 的 时 钟 频率 ， 从 而 使 
得 系统 处 理 的 任务 量 最 大 化 ， 系 统 的 任务 量 定义 如 下 : 


1 


Throughput = Ljw'scoa (5.5) 
So 


式 中 ，w 为 权重 向 量 ; t, 是 基于 任务 分 配 的 决策 时 间 间 隔 ; s(t) 是 在 1 时 刻 向 处 
理 器 核心 进行 任务 分 配 的 速度 向 量 。 通 过 对 目标 函数 进行 简化 假设 条 件 来 改善 该 
优化 问题 的 计算 复杂 度 ， 而 不 是 把 系统 任务 的 处 理 量 视 为 一 个 连续 的 实体 ， 在 每 
一 个 任务 分 配 决策 时 间 间 隔 的 开始 时 刻 的 瞬时 处 理 量 最 大 。 这 简化 了 确定 处 理 髓 
核心 速度 的 问题 ,并且 利用 了 给 定 的 速度 分 配 ， 有 助 于 该 方法 将 后 续 的 任务 分 配 
问题 表示 为 线性 优化 问题 ， 然 后 利用 0S 领域 的 经 典 优化 技术 Munkres 算法 来 实 
时 地 解决 任务 分 配 问题 [8] 。 

除了 CMP 外， 还 对 MPSoC 进行 热 缓解 方面 的 研究 。 使 用 ILP 算法 ， 针 对 
MPSoC 提出 了 一 种 静态 任务 调度 器 ， 该 调度 器 的 目的 是 使 处 理 器 的 峰值 温度 达 
到 最 低 ， 同 时 使 其 温度 梯度 更 加 平滑 :9] 。 调 度 器 旨 在 满足 任务 的 实时 截止 时 间 
和 任务 之 间 的 依赖 约束 ， 同 时 使 处 理 器 芯片 上 热点 的 温度 和 温度 梯度 都 最 小 。 假 
定 一 份 任务 表 作 为 输入 变量 赋 给 任务 调度 器 ， 该 任务 表 中 的 每 项 任务 具有 已 知 的 
依赖 关系 、 任 务 的 最 终 时 间 期 限 和 最 坏 情况 下 的 运行 时 间 (WCET), ILP 算法 公 
式 的 目标 函数 有 两 部 分 ， 第 一 部 分 包括 了 数额 对 温度 的 影响 ， 数 额 的 意思 是 指 处 
理 器 温度 超过 安全 温度 阔 值 以 上 所 经 历 的 时 间 长 短 ， 计 算 了 所 有 处 理 器 中 所 有 这 
样 时 间 的 总 和 以 及 将 某 个 任务 附加 给 处 理 器 所 花费 的 决策 时 间 ; 第 二 部 分 表示 两 
颗 邻 近 处 理 器 重合 任 务 的 数量 ， 这 些 任务 具有 重 秋 的 执行 时 间 ， 最 大 限度 地 减少 
了 处 理 器 这 一 高 度 活跃 的 时 间 长 度 ， 这 将 有 助 于 减少 热点 的 产生 。 处 理 器 温度 在 
安全 温度 阔 值 以 上 的 时 间 首 先 通过 每 个 任务 的 WCET 粗略 地 估算 得 出 ， 通 过 求 
解 ILP 算法 公式 找到 处 理 器 的 初始 任务 分 配方 案 ， 此 ILP 算法 由 目标 函数 、 依 赖 
性 约束 和 任务 的 最 终 时 间 期 限 约 束 组 成 。 所 得 到 的 任务 分 配方 案 被 导入 到 温度 仿 
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真 系统 中 以 计算 得 出 处 理 器 的 实际 峰值 温度 ， 然 后 使 用 这 些 温度 数据 来 改进 处 理 
器 在 温度 国 值 以 上 所 花费 时 间 的 估算 ， 对 ILP 算法 进行 再 次 求解 并 得 出 最 终 的 任 
务 分 配方 案 。 此 外 ， 还 提出 了 针对 调度 器 的 改善 以 放松 对 已 知 任务 表 确 切 结构 的 
假设 , 但 是 在 实际 应 用 中 这 可 能 不 适用 。 改 进 的 HY 型 调度 器 利用 动态 调度 器 使 
用 温度 传感器 的 反馈 对 任务 的 调度 决策 在 运行 过 程 中 进行 调整 2] 。 

这 种 动态 调度 器 配备 有 几 种 不 同 复杂 度 的 模式 。 这 里 所 尝试 的 最 简单 模式 是 
基于 温度 传感器 的 读数 被 动 地 执行 调度 。 在 每 个 调度 时 间 间 隔 的 开始 ， 新 安排 的 
任务 被 调度 给 温度 最 低 的 处 理 器 。 该 方案 最 直接 的 一 个 变化 就 是 挑选 出 具有 最 大 
数量 空 闪 相 邻 的 低温 处 理 器 ， 以 尽量 减少 处 理 器 的 横向 热 传 递 。 第 三 个 策略 则 在 
找到 系统 负载 均衡 与 温度 优化 之 间 的 中 间 地 带 ， 每 一 个 处 理 器 都 有 被 分 配 安排 下 
一 个 任务 的 概率 ， 在 考虑 到 处 理 器 历史 温度 的 情况 下 ， 在 每 个 任务 调度 时 间 间 隔 
的 起 始点 对 这 些 概率 进行 更 新 。 这 些 概率 数据 会 实时 地 增 大 或 者 减 小 ， 直 到 它们 
变 成 0 或 者 1 时 达到 饱和 。 其 中 一 种 极端 的 情况 是 ， 如 果 某 个 处 理 器 在 前 一 个 调 
度 时 间 间 隔 已 经 超过 了 芯片 的 安全 温度 阔 值 7,,,， 则 在 当前 的 调度 时 间 间 隔 其 概 
率 被 设置 为 0。 第 二 个 温度 极限 Ti,, 定 义 为 表示 处 理 器 接近 其 峰值 温度 的 一 个 中 
间 状 态 ， 该 研究 中 Tov 和 7, 分 别 设置 为 75%C 和 85%C。 男 一 个 极端 情况 是 ， 如 
果 处 理 髓 的 温度 在 最 近 的 一 次 调度 时 间 间 隔 保 持 在 Ti ,和 了， 之 间 ， 则 其 概率 不 
会 被 改变 。 对 于 没有 出 现 超过 7 峰值 温度 的 所 有 其 他 人 处理 器 ， 其 调整 因子 定义 
Ap FE 


. B 
Waa (5.6) 


Trois 

芯片 内 部 各 功能 单元 之 间 的 相互 热 作 用 超出 了 世 片 内 核心 与 核心 之 间 的 热 耦 
合 。 在 这 种 情况 下 ， 温 度 对 芯片 本 体 各 网 络 单元 的 影响 已 经 通过 强化 学 习 方法 进 
行 了 研究 ， 以 用 于 热 感知 任务 分 配 呈 ] 。 优 化 的 目标 是 使 芯片 本 身 的 整体 峰值 温 
度 最 低 ， 对 芯片 核心 的 任务 分 配 将 会 影响 蕊 片 的 数据 传输 以 及 由 此 产生 的 芯片 路 
由 网 络 的 温度 分 布 。 因 此 ， 这 些 因素 也 需要 考虑 在 内 。 在 此 项 研究 中 提 到 的 方法 
是 使 用 了 基于 强化 学 习 的 方法 ， 并 根据 随后 对 芯片 热 状态 的 预测 判断 ， 来 决定 对 
处 理 需 任务 如 何 进行 分 配 。 然 后 ， 利 用 温度 传 感 需 的 实际 反馈 来 评估 这 些 决 定 ， 
并 且 促 使 更 好 解决 方案 的 那些 行为 的 “奖励 指标 ”不 断 地 被 改进 优化 。 该 强化 

学 习 方法 的 “奖励 指标 ”定义 为 
Reward = Tim — Toe (5.7) 
在 每 一 个 时 间 步 长 +， 效用 函数 0 将 特定 的 “奖励 指标 ”r、 任 务 分 配 决 策 
a、 从 温度 传感器 收集 得 到 的 热 状态 tem 映射 到 系统 中 的 期 望 温度 。 从 时 间 步 长 t 
到 无 穷 大 ， 该 效用 函数 在 整个 范围 内 将 期 望 值 相 加 在 一 起 ， 而 在 时 间 步 长 ++1 
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以 及 之 后 的 时 间 内 ， 基 于 未 来 的 预测 将 被 乘 以 一 个 折扣 因子 y。 如 下 ， 效 用 函数 
有 助 于 构建 任务 分 配 策略 [1 : 


Q(tem,a) = E | Y ns | tem, = tem,a, = a) | (5.8) 


在 每 个 时 间 步 长 +1 时 刻 , 已 知 时 间 i 时 刻 任务 分 配 决策 为 a,， 以 及 此 时 刻 
的 温度 结果 tem, All tem ,1， 式 (5.8) 中 所 示 的 广义 效用 函数 可 以 近似 为 
Q, (tem,,,,a) = Qi(tem,a) + a(ri(tem,a) + y max,-Q,(5,,;,@') - Qi ,a)) 

(5.9) 

该 迭代 方程 通过 使 用 一 个 时 间 步 长 的 历史 记录 来 近似 效用 函数 ， 并 且 引 入 所 
谓 的 学 习 速 率 参数 a 以 促进 迭代 模型 的 收敛 。 每 个 任务 分 配 以 后 ， 通 过 芯片 内 
置 的 温度 传感器 收集 其 温度 状态 ， 并 利用 该 信息 评估 出 “奖励 指标 ”， 从 而 改善 
优化 效用 函数 。 

部 署 在 CMP 和 MPSoC 的 3D IC 中 的 操作 系统 需要 更 好 地 了 解 热管 理 。 为 了 
应 对 这 种 日 益 增 长 的 需求 ， 开 发 了 各 种 各 样 的 技术 。 一 个 重要 的 优化 参数 是 ， 防 
止 具有 大 发 热量 的 任务 沿 着 垂直 方向 在 相 邻 核心 中 运行 的 程度 。 这 是 造成 大 量 热 
量 被 束缚 在 3D IC 内 层 并 产生 热点 的 主要 原因 之 一 ， 这 些 热点 将 危害 芯片 的 可 靠 
性 并 增加 芯片 的 漏电 功率 。 

由 于 高 活性 任务 的 垂直 堆 释 容易 产生 热点 ， 为 了 缓解 热点 的 形成 而 开发 了 一 
种 方法 ， 该 方法 引入 了 两 个 概念 : 超级 核心 和 超级 任务 [2] y HEB ZB TE 
垂直 方向 上 对 齐 的 核心 组 成 一 个 超级 核心 ， 因 为 这 些 核心 上 的 活动 直接 影响 彼此 
的 热 分 布 ， 所 以 需要 以 相互 协调 的 方式 在 超级 核心 上 做 出 任务 调度 。 超 级 任务 是 
分 配给 一 个 超级 核心 的 任务 的 集合 。 任 务 调度 算法 所 恪守 的 一 个 重要 特点 是 ， 根 
据 3D 集成 电路 的 具体 平面 布局 来 定制 调度 算法 。 主 要 有 两 种 方法 来 规划 主要 的 
单元 块 〈 比 如 核心 和 缓存 ) 。 第 一 种 方法 是 均匀 规则 地 对 它们 进行 分 层 ， 在 所 有 
分 层 中 重复 相同 的 基本 模式 ， 这 简化 了 硅 通 孔 的 排 布 ， 从 而 实现 了 通信 接口 的 物 
理 设计 的 固定 模式 。 该 平面 布局 的 缺点 是 ， 有 具有 类 似 热 分 布 的 单元 块 ， 例 如 高 功 
率 密度 的 核心 ， 将 完全 相互 对 齐 ， 因 此 聚集 的 热点 会 更 加 突出 。 第 二 种 方法 是 根 
据 热 量 的 相互 作用 来 修改 该 常规 平面 布局 ， 并 且 避 免 相 互 邻近 闭 层 之 间 的 高 功率 
密度 核心 的 直接 重 倒 。 这 通常 通过 设计 一 个 主 模式 来 完成 ， 其 中 高 功率 密度 和 低 
功率 密度 的 单元 块 (例如 高 速 绥 存 ) 相互 交错 ， 然 后 在 每 一 个 堆 钱 层 中 将 该 布 
局 旋转 90% 。 因 此 ， 在 两 个 连续 相 邻 的 堆 磊 层 中 ， 芯 片 的 核心 和 高 速 缓存 单元 
块 大 多 垂直 重合 。 图 5.3 展示 了 在 使 用 每 层 两 个 核心 的 抽象 3D 集成 电路 上 ， 均 
匀 规 则 布局 和 不 规则 布局 的 示例 。 如 前 所 述 ， 用 于 此 设计 的 互联 结构 更 具 挑 战 
性 ， 因 为 将 硅 通 孔 延 伸 穿 过 高 速 缓 存单 元 块 的 内 部 将 更 加 困难 ， 这 些 单元 块 具有 
密集 且 均 匀 布 局 的 阵列 。 然 而 ， 面 对 严峻 的 热 挑 战 ， 在 设计 中 这 些 开 销 可 能 被 
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允许 。 

管理 规则 布局 的 超级 核心 和 超级 任 : 
务 的 调度 算法 执行 两 步 优化 。 由 天 个 堆 | me | Ee SEDE 

n — 

AJA IN 3D 集成 电路 芯片 ， 超 级 任 [o uan | 
务 将 由 个 任务 组 成 ， 因 为 沿 着 一 个 垂 二 人 
直列 将 存在 个 核心 。 在 m 个 可 用 任 xd aie me 
务 中 ， 形 成 个 超级 任务 ， 使 得 超级 任 D SF | ET 
Cu pU e a KMS =] 
简单 的 适合 实时 执行 的 “ 装 箱 算法 "”， 上 请 | 6e | 
其 中 普 个 任务 首先 按照 其 各 自 预 估 的 Ba | 核心 


功 耗 以 递增 顺序 排序 。 然 后 ， 按 照 该 排 
列 顺序 ， 将 每 个 任务 放置 到 具有 最 小 当 "RM 
种 功 耗 均衡 的 超级 核心 预计 也 会 形成 超 b) Aen, ANE SE Eo Poo RP LE 
级 核心 之 间 功 耗 密度 的 均匀 分 布 。 在 调 “并 旋转 180°, Ate 3D CMP a Bol ANTE GE RUE 
度 算法 的 第 二 步 ， 在 任意 调度 时 间 段 内 〈 每 8us) ， 超 级 核心 内 所 有 核心 的 温度 
加 在 一 起 以 获得 超级 核心 的 具有 代表 性 的 温度 指标 ， 最 小 功 耗 的 超级 任务 分 配给 
具有 最 高 温度 指标 的 超级 核心 。 类 似 地 ， 在 超级 核心 内 ， 超 级 任务 被 分 解 成 多 个 
独立 的 任务 ， 用 于 分 配给 各 独立 的 核心 ， 其 中 具有 最 高 温度 的 核心 被 安排 给 具有 
最 小 功 耗 的 任务 。 

对 于 不 规则 的 布局 设计 ， 调 度 算法 也 会 不 同 。 任 务 以 三 种 不 同 的 方式 进行 分 
组 ， 以 便 在 其 功 耗 分 布 中 创建 多 样 性 的 高 低 不 同 的 功 耗 。 与 规则 的 布局 不 同 ， 从 
每 个 不 规则 的 超级 核心 到 散热 器 之 间 的 有 效 热 阻 也 会 各 不 相同 。 如 果 各 超级 核心 
之 间 的 温度 差 很 大 ， 这 意味 着 在 下 一 个 调度 时 间 间 隔 内 有 必要 进行 显著 的 温度 调 
节 。 然 后 ， 在 诸多 超级 任务 中 将 选择 功 耗 变化 大 的 任务 ， 并且 允 许 对 超级 核心 分 
配 一 个 偏离 实际 的 功 耗 。 如 果 各 超级 核心 之 间 的 温度 差 不 大 ， 则 仍然 可 以 以 均衡 
的 方式 形成 超级 任务 。 

随后 的 工作 将 3D 集成 电路 的 动态 电压 调节 和 任务 调度 结合 在 一 起 ， 并 日 类 
似 地 融合 了 沿 垂 直 维 度 热 关联 的 重要 概念 ， 以 优化 电压 和 任务 分 配 决 策 !231 S xx 
种 方法 利用 了 前 面 讲 到 的 超级 核心 的 概念 21 。 类 似 地 ， 沿 垂直 方向 对 齐 的 芯片 
核心 被 划分 组 成 一 个 超级 核心 。 比 如 ， 在 一 个 具有 两 个 二 层 的 集成 电路 内 部 ， 每 
个 赫 层 都 具有 四 个 核心 ， 两 个 垂直 相 邻 的 核心 形成 一 个 超级 核心 。 由 此 将 该 芯 
划分 为 四 个 超级 核心 。 在 操作 系统 的 每 个 调度 时 间 间 隔 的 开始 点 ， 将 准备 好 的 任 
务 划 分 为 两 组 (对 于 一 个 具有 两 苹 层 的 集成 电路 芯片 )， 使 得 具有 和 较 大 预测 功 耗 
的 任务 与 具有 最 小 预测 功 耗 的 任务 配对 。 调 度 器 则 在 将 当前 具有 最 小 功 耗 的 任务 


a) b) 
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分 配给 温度 最 高 的 核心 ， 以 便 不 再 加 剧 其 热 负 蓓 。 

男 一 项 研究 首先 开始 研究 现 有 用 于 热管 理 的 OS 层 策略 的 有 效 性 ， 并 进一步 
提出 了 热 感知 作业 调度 器 [*1。 这 项 研究 将 芯片 核心 的 热 应 力 与 其 到 散热 器 的 距 
离 相 关联 ， 并 且 相 应 地 为 每 个 核心 分 配 一 个 热 指 数 Index", (rus ERE 
层 中 的 核心 距离 散热 器 较 近 ， 因 此 更 容易 散热 。 使 用 概率 调度 器 ， 其 中 在 每 个 调 
度 时 间 间 隔 i， 每 个 核心 <， 具有 Pi 的 概率 分 配给 新 任务 。 根 据 以 下 标准 ， 在 每 
个 调度 时 间 间 隔 内 ， 该 概率 值 以 + 了 双 或 者 - 允 为 增 量 进 行 调整 s 
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的 历史 平均 温度 。 在 该 研究 中 ， 采 用 了 最 后 10 4-358] BE SE TRI Pa) BCS B SE, Rn 


后 ， Bi 和 Bi 是 经 验 常数 。 


5.2 嵌入 式 实时 系统 的 OS 层 热管 理 策略 


般 入 式 系统 代表 了 计算 机 硬件 中 的 一 个 重要 领域 ， 它 们 的 主要 特点 是 任务 管 
理 的 实时 性 。 其 他 高 性 能 计算 系统 也 可 以 提供 具有 独特 性 能 预期 的 实时 应 用 程 
FR ERPF, RST BIRTH A SRR EHET 


专门 的 讨论 ， 并 对 实时 系统 进行 一 般 性 论 s 
述 。 这 些 系统 在 运行 过 程 中 ， 会 通过 不 同 RA 


YERL 


CD 任务 T, UN 
WCET 

e (13) AILEY TREK) 
act 


的 方法 进行 自身 性 能 的 提升 ， 以 便 更 加 有 
效 地 管理 散热 和 对 温度 进行 控制 。 通 常 来 
讲 ， 在 嵌入 式 实时 系统 中 执行 计算 密集 型 
应 用 (例如 信号 处 理 、 视 频 编码 和 解码 ) 
会 提高 系统 的 工作 温度 ， 特 别 是 考虑 到 这 
些 系 统 可 能 会 受到 尺寸 大 小 的 限制 ， 不 能 
采用 高 性 能 冷却 方案 ， 系 统 内 的 温度 将 会 
快速 地 上 升 。 

嵌入 式 系统 可 以 通过 两 种 主要 的 方式 
HRR, SAE RAYE SS BMPS eee 
Hol: UES ARCANE, NUBREMLAGUE 每 个 任务 的 特征 是 都 具有 一个 WCET 


统 上 周期 性 地 重复 。 每 个 单独 任务 的 特征 。 ”任务 表 与 一 个 时 间 周期 有 关 ， 其 中 
是 通常 都 具有 一 个 WCET, BLA GR AO fe ae 


常 由 单个 或 多 个 处 理 单元 (PE) 表示 ， 该 处 理 单元 能 够 执行 任务 表 中 的 节点 。 
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图 5.4 归 总 了 定义 面向 能 入 式 系统 任务 表 的 主要 特性 ， 岁 5. 5 给 出 了 在 具有 两 个 
PE 的 藤 入 式 系统 上 执行 周期 性 任务 表 的 示例 。 


PE1| Tl | T2 | T4 | T6 Tl T2 T4 T6 


图 5.5 在 具有 两 个 PE 的 系统 上 调度 的 周期 性 任务 表 ，PE 可 以 是 CPU, ASIC 等 


任务 的 静态 分 配 和 调度 决定 可 以 通过 热 识 别 进行 。 划 入 该 类 别 的 技术 通常 在 
多 次 迭代 中 执行 任务 分 配 和 调度 (例如 列表 调度 、 力 导向 调度 ) ， 其 中 在 每 次 迭 
代 中 处 理 最 关键 的 任务 。 一 旦 确定 了 一 个 任务 子 集 ， 则 重新 计算 剩余 任务 的 关键 
性 以 便 开 始 下 一 次 迭代 。 和 迭代 循环 不 停 地 进行 ， 直 到 处 理 完 成 整个 任务 表 。 通 过 
这 些 方法 ， 任 务 的 关键 性 主要 根据 它们 对 最 终 调 度 的 总 关键 路 径 和 /或 吞吐 量 的 
贡献 以 及 当前 时 间 步 长 与 任务 的 最 终 时 间 期 限 ( 如果 它 已 被 定义 ) 之 间 的 空余 
量 的 角度 来 决定 。 已 经 提出 了 一 种 扩展 这 一 基本 原理 的 热 感知 方法 ， 其 中 这 个 关 
键 性 衡量 指标 在 内 迭代 循环 中 使 用 热 模 拟 器 在 整个 芯片 的 预期 峰值 温度 下 得 到 增 
强 [531]。 很 自然 ,下 一 个 逻辑 扩展 是 考虑 运行 时 的 调度 机 制 。 该 研究 还 提出 了 基 
CFA GX MPSoC 芯片 的 一 种 启发 式 算法 ， 用 于 任务 的 热 感知 动态 调度 [25] 。 这 种 
算法 可 以 识别 出 能 够 在 备用 处 理 单元 (PE) 上 运行 的 任务 (在 这 种 情况 下 ， 假 
设 系统 由 同类 PE 组 成 ) ， 并 且 在 备用 的 处 理 单元 上 重复 地 调度 该 任务 。 虽 然 在 
该 研究 中 未 提供 该 算法 的 具体 细节 ， 但 可 以 设想 各 种 不 同 的 替代 算法 。 该 算法 的 
基本 原理 是 保持 多 个 处 理 单元 (PE) 之 间 任 务 负载 的 均衡 ， 从 而 使 得 它们 的 有 
效 功 率 密度 是 均匀 的 。 假 设 每 个 处 理 单 元 是 相同 的 ， 则 认为 总 功 耗 将 保持 不 变 ， 
无 论 迁 移 的 任务 在 什么 地 方 运 行 。 虽 然 这 种 优化 可 以 通过 来 回 地 迁移 单个 任务 来 
实现 ， 但 是 它 也 可 以 再 进行 扩展 ， 以 便 能 够 识别 出 一 对 任务 ， 其 中 一 个 任务 具有 
更 多 的 时 间 余 度 。 通 过 托管 具有 更 多 时 间 余 度 的 任务 ， 每 个 处 理 单元 都 可 能 从 停 
机 时 间 中 受益 ， 以 便 在 系统 空 闪 时间 内 得 到 冷却 。 此 外 ， 在 该 空 闪 时 间 段 内 ， 处 
理 单元 (PE) 可 以 被 置 于 睡眠 模式 ， 以 进一步 降低 系统 功 耗 。 

最 近 提出 了 一 种 新 的 调度 策略 用 于 热 感知 负载 平衡 与 调度 ， 特 别 考虑 到 一 些 
物理 方面 的 因素 诸如 不 同 处 理 单元 的 位 置 以 及 它们 从 芯片 内 置 温 度 传感器 收集 到 
的 温度 历史 数据 [251 。 本 研究 已 经 认识 到 骨 入 在 传统 OS 中 的 现 有 策略 ， 比 如 随 
机 调度 策略 〈 在 各 核心 之 间 随 机 分 配 任务 ) 。 该 策略 将 队列 中 的 下 一 个 任务 分 配 


集成 电路 热管 理 ; 片上 和 系统 级 的 监测 及 冷却 


给 当前 温度 最 低 的 核心 ， 并 且 在 分 配 任务 时 也 考虑 了 邻近 核心 的 温度 。 该 策略 已 
经 被 发 展 成 为 这 些 技 术 的 一 种 延伸 。 调 度 策略 扩展 了 核心 温度 的 概念 ， 同 时 引入 
了 邻近 核心 的 历史 温度 。 此 外 ， 此 策略 适用 于 周期 性 任务 表 ， 其 中 这 些 任务 具有 
弱 截 止 时 间 ， 并 且 它 们 也 可 以 被 其 他 任务 抢占 。 任 务 的 调度 质量 由 成 本 函数 来 衡 
量 ,， 该 成 本 函数 具有 两 个 子 项 : 第 一 项 表示 每 个 任务 1 的 完成 时 间 与 其 弱 截 止 时 
间 之 间 的 差 值 ， 如 果 超 过 了 截止 时 间 ， 则 该 因子 在 成 本 函数 中 作为 惩罚 项 ， 与 每 
个 任务 的 运行 时 间 成 正比 ; 第 二 项 表示 分 配 一 项 任务 5 对 处 理 融 带 来 的 热 影 响 ， 
给 定 处 理 器 的 当前 热 状 态 以 及 任务 # 结束 运行 以 后 预测 的 热 状态 ， 这 可 以 通过 处 
理 圳 平均 温度 的 变化 进行 热 状态 的 预测 。 该 任务 在 系统 中 一 段 固定 的 历史 时 间 内 
发 生 过 。 同 时 ， 如 果 发 现 预 测 的 温度 将 会 超过 硬件 系统 的 安全 温度 阔 值 ， 则 不 允 
许 在 处 理 需 上 和 运行 该 任务 。 如 果 在 准备 就 绪 的 任务 队列 中 没有 任务 在 给 定 的 处 理 
器 上 运行 ， 没 有 使 处 理 吉 温度 超过 安全 温度 浆 值 ， 则 该 处 理 器 在 接 下 来 的 几 个 调 
度 时 间 间 隔 内 将 处 于 空闲 状态 。 该 策略 的 另 一 方面 是 它 还 包含 了 核心 的 温度 饱和 
概念 ， 避 免 出 现 一 些 核心 已 经 达到 了 其 允许 的 最 高 温度 ， 而 其 他 核心 的 温度 却 明 
显 偏 低 。 任 务 迁 移 从 已 经 达到 温度 饱和 的 核心 开始 ， 并 将 其 任务 印 载 到 历史 温度 
最 低 的 核心 上 。 

另 一 项 研究 主要 集中 在 能 人 式 系统 中 作业 并 行 与 温度 之 间 的 关系 ”1] 。 在 该 
研究 中 ， 一 项 作业 是 指 一 系列 任务 的 集合 ， 并 可 以 同时 使 用 一 个 或 多 个 处 理 器 。 
对 于 这 样 一 项 作业 ， 可 能 存在 一 个 在 给 定时 刻 需 要 多 少 处 理 吕 用 于 完成 其 计算 负 
载 的 平衡 点 。 具 体 来 讲 ， 这 项 研究 调查 了 三 种 类 型 的 作业 ， 其 一 作业 可 以 分 配给 
固定 数量 的 处 理 器 ， 该 处 理 顺 处 于 调度 器 作用 范围 之 外 ; 其 二 作业 可 以 通过 调度 
顺 分 配 固定 数量 的 处 理 咒 ; 最 后 一 种 ， 在 其 整个 运行 过 程 中 ， 作 业 通 过 调度 器 分 
配给 变化 数量 的 处 理 器 ， 作 业 在 一 个 周期 性 任务 系统 中 排列 顺序 ， 并 附带 有 最 终 
时 间 期 限 。 在 这 种 情况 下 ， 如 果 作业 的 各 个 线程 在 物理 空间 上 分 布 在 多 个 处 理 咒 
上 ， 则 所 形成 的 热 状 态 将 受到 线程 的 相对 位 置 以 及 每 个 处 理 器 选择 的 工作 点 的 影 
啊 。 这 种 相互 作用 是 非常 复杂 的 ， 因 为 在 动态 管理 的 多 核心 系统 中 ， 执 行 相同 作 
业 的 、 并 行 运行 的 各 个 处 理 需 也 可 能 处 于 不 同 的 工作 电压 和 工作 频率 ， 从 而 导致 
功率 密度 在 物理 空间 上 的 变化 。 因 此 ， 该 研究 指出 ， 需 要 在 线 调度 算法 在 各 个 处 
理 器 之 间 分 发 作业 线程 ， 并 且 确 定 它们 的 工作 频率 ， 同 时 单独 为 每 个 处 理 需 设 定 
一 个 峰值 温度 。 

藤 入 式 系统 出 现 了 一 个 独特 的 挑战 ， 该 挑战 源 于 其 操作 环境 ， 而 在 其 他 计算 
系统 中 未 发 现 过 。 磐 人 式 系统 可 以 部 署 在 温度 条 件 发 生 巨 大 变化 的 环境 中 。 此 
外 ， 对 于 一 个 国定 的 系统 ， 这 些 温度 条 件 可 以 随 着 时 间 发 生 显著 的 变化 。 该 项 研 
究 主 要 集中 在 这 一 方面 ， 在 变化 的 环境 温度 条 件 下 开发 出 负载 均衡 方案 ”| 。 基 
于 汽车 领域 的 芯片 技术 规格 ,剧烈 变化 的 环境 温度 是 一 种 典型 条 件 ， 授 入 式 系统 
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被 模拟 成 具有 时 间 期 限 和 WCET 的 周期 性 任务 集 。 环 境 温 度 的 这 种 波动 容易 引 
起 芯片 中 的 冷 热 交 替 ， 从 而 大 大 降低 其 可 靠 性 。 对 于 没有 冷却 风扇 和 复杂 动态 功 
耗 管理 机 制 的 从 入 式 系统 ， 热 失控 在 现实 中 也 变 成 了 一 种 威胁 。 这 项 特别 的 研究 
提出 了 一 种 实时 操作 系统 (RTOS) 动态 迁移 任务 的 机 制 ， 使 得 所 有 任务 的 实时 
截止 时 间 可 以 得 到 保证 ， 同 时 系统 可 以 修改 空闲 核心 的 数量 以 及 核心 的 工作 电 
压 / 频 率 的 设置 ， 使 得 系统 经 历 冷 热 交 蔡 的 次 数 最 少 。 系 统 在 多 核心 世 片 上 使 用 
一 个 全 局 任务 排队 体系 ， 每 个 核心 的 温度 都 通过 各 自 的 温度 传 感 需 采集 得 到 。 当 
系统 处 于 离线 状态 时 ， 对 于 多 个 温度 水 平 〈 所 有 核 芯 的 峰值 温度 ) ， 通 过 利用 最 
少数 量 的 核心 找到 工作 频率 的 静态 配置 ， 使 得 在 不 违反 其 最 终 时 间 期 限 的 条 件 下 
执行 任务 集 ， 并 存储 在 配置 表 中 。 在 系统 运行 时 ， 根 据 温度 传 感 需 的 读 值 检测 当 
前 的 温度 水 平 ， 并 从 配置 表 中 查找 相应 的 配置 。 根 据 给 定 配置 所 需要 的 核心 数 
量 ， 剩 余 的 核心 可 以 被 设 定 为 空闲 模式 ， 而 且 如 果 下 一 阶段 中 的 活动 核心 数量 少 
于 前 一 个 调度 间隔 中 的 活动 核心 数量 ， 则 RTOS 会 将 任务 从 即将 被 置 于 空闲 模式 
的 核心 上 迁移 走 。 创 建 这 些 配置 ， 在 考虑 到 时 间 限 制 的 条 件 下 ， 会 使 得 在 更 高 的 
温度 下 有 更 多 数量 的 核心 优先 进入 睡眠 状态 。 此 外 ,在 粗 颗 粒度 的 时 间 (任务 
表 周期 的 倍数 ) 内 ， 以 循环 方式 重新 配置 活动 核心 ， 从 而 进一步 在 芯片 上 均匀 
地 分 布 功率 密度 ， 可 使 得 某 些 核心 而 不 是 其 他 核心 经 常 被 置 于 空 闪 模式 。 

虽然 大 部 分 脱 入 式 系统 可 以 执行 工作 负载 确定 、 定 义 明确 的 应 用 程序 ， 但 是 
新 兴 的 高 性 能 能 入 式 系统 在 特定 领域 内 变 得 更 通用 ， 在 该 领域 内 工作 负载 仅 在 运 
行 时 才 显 示 甚 结构 组 成 。 该 项 研究 主要 集中 在 具有 非 确定 性 工作 负载 的 多 核心 获 
和 信 式 系统 的 热 问 题 [”] 。 基 于 实时 变化 的 工作 负载 ， 运用 “实时 演算 理论 ”为 每 
个 任务 估算 出 一 个 新 的 WCET (RO?! 。 我 们 假设 多 核心 芯片 含有 相同 类 型 的 PE 
集合 ， 在 任务 分 配 时 也 考虑 了 热 问 题 。 每 个 PE 被 分 配给 一 个 时 钟 频率 ， 以 便 在 
任务 分 配 之 前 在 最 终 时 间 期 限 内 执行 全 部 预计 的 工作 负载 。 接 下 来 ， 对 于 每 个 任 
务 ， 任 务 的 分 配 问 题 通过 一 个 非 线性 二 进 制 整数 程序 的 形式 来 表达 。 主 要 考虑 的 
是 ， 对 于 每 个 任务 ， 目 标 PE 必须 存在 ， 以 便 可 以 满足 任务 的 预计 运行 时 间 。 在 
执行 此 分 配 时 ， 使 用 世 片 的 等 效 热 RC 网 络 模型 估算 出 在 处 理 单 元 (PE) 上任 
务 的 峰值 温度 。 应 该 注意 ,评估 每 个 潜在 分 配 的 热 状态 将 会 产生 额外 的 计算 开 
销 ， 这 在 实时 应 用 程序 中 并 不 适合 。 于 是 提出 了 一 种 元 启发 式 算法 ， 通 过 在 同一 
个 评估 步骤 中 合并 多 个 相关 联 的 任务 分 配 来 更 有 效 地 进行 热 评 佑 。 该 评估 由 两 个 
阶段 组 成 ， 首 先 每 个 处 理 单元 (PE) 的 温度 估算 被 分 解 成 两 项 : 一 个 是 与 任务 
分 配 无 关 的 分 量 ; 男 一 个 是 与 任务 分 配 有 关 的 分 量 。 对 于 所 有 的 任务 分 配 ， 先 计 
算 一 次 与 分 配 无 关 的 分 量 。 对 于 具体 任务 分 配 的 温度 项 ， 也 可 以 通过 观察 两 个 分 
配 之 间 的 差异 进而 进行 简化 。 一 些 任务 的 分 配 将 只 在 有 限 的 几 个 任务 中 存在 差 
异 ， 这 几 个 有 限 的 任务 放置 在 不 同 的 PE 上 ， 而 其 余 的 任务 可 能 完全 重大 。 在 这 
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些 情况 下 ,一 旦 对 其 中 一 个 任务 分 配 进行 估算 温度 ， 则 可 以 通过 更 新 非 重 全 任务 
来 渐进 地 计算 下 一 个 相似 的 任务 分 配 的 温度 。 

前 面 描述 的 任务 分 配 算法 可 能 导致 对 温度 估算 产生 误差 ， 特 别 是 由 于 为 了 控 
制 计算 开销 而 引入 了 简化 。 对 于 没有 内 置 温 度 传感器 的 般 入 式 系 统 ， 这 些 可 能 是 
必要 的 。 然 而 ， 很 多 部 署 在 藤 入 式 系统 中 的 多 核心 已 片 都 有 内 置 温 度 传感器 ， 可 
以 利用 这 些 温度 传感器 来 增强 和 改进 在 该 算法 中 使 用 的 温度 估算 程序 。 

另 一 项 研究 同样 挑战 了 针对 单个 应 用 定制 的 庶 和 人 式 系 统 的 传统 假设 ， 并 提出 
了 一 种 调度 方法 以 便 管 理 不 同 应 用 程序 组 合 中 的 任务 1311 。 举 例 来 说 ， 移 动 通信 
设备 〈 比 如 智能 手机 ) 的 多 任务 ， 可 以 执行 多 种 应 用 ， 诸 如 音频 、 视 频 、 网 页 
浏览 等 。 不 同 应 用 的 特性 将 会 导致 不 同 的 热 响 应 ， 在 系统 的 操作 温度 维持 在 安全 
阅 值 以 下 的 同时 ,将 以 最 大 限度 地 追求 性 能 为 目标 ， 比 如 追求 不 同 的 应 用 程序 之 
间 调 用 计算 资源 的 吞吐 量 和 公平 性 。 该 系统 的 另 一 个 不 同 特性 是 ， 任 务 组 合 中 的 
一 些 任务 具有 周期 性 的 弱 实 时 截止 时 间 (例如 ， 帧 / 秒 的 视频 处 理 任务 )， 而 其 
他 任务 对 延迟 和 质量 下 降 具 有 更 高 的 容 恳 度 (Køl, 文字 处 理 ) 。 在 本 研究 中 这 
些 任 务 被 划分 为 “尽力 而 为 ”的 任务 。 基 本 方法 是 利用 一 种 机 制 来 估算 任务 的 
热 影响 ， 并 对 这 些 任务 进行 优先 调配 ， 这 将 导致 系统 温度 小 幅度 升 高 。 同 时 ， 该 
机 制 还 追求 任务 吞吐 量 和 公平 性 之 间 的 平衡 。 如 果 当 前 温度 ( 即 初始 温度 Tua) 
是 已 知 的 ， 而 且 该 任务 在 未 来 一 段 时 间 上 内 运行 ， 则 可 以 使 用 温度 预测 模型 来 得 
到 系统 期 望 的 温 升 。 在 运行 时 间 周 期 上 内 系统 达到 的 温度 可 通过 如 下 模型 得 到 
T(t) = T, - (T, - T.) x e* (5.10) 

如 果 同 一 任务 运行 时 间 周 期 为 无 限 长 时 ， 系 统 稳定 时 达到 的 稳 态 温度 为 了 。 
通过 芯片 内 置 温度 传感器 ， 任 务 从 已 知 的 初始 温度 Taa 开始， 运行 一 段 具 体 的 时 
[B] c 后 达到 温度 7.， 通 过 观察 温度 7. 可 以 得 出 温度 To, BH 

ie ee (5.11) 
ss (6.8) . 

式 中 , 天 是 处 理 器 系统 具体 硬件 的 热 常 数 。 在 线 调度 器 使 用 该 模型 来 评估 具有 弱 
截止 时 间 的 任务 ， 并 且 预 测 在 给 定时 刻 是 否 允 许 执 行 选择 的 任务 而 不 超过 系统 的 
i BE ER] (B 

调度 器 由 两 个 特定 的 调度 器 分 量 组 成 : 一 个 分 量 是 基于 弱 实 时 任务 调度 ; 另 
一 个 分 量 是 基于 “尽力 而 为 ”的 任务 。 对 于 每 一 个 任务 ， 调 度 需 预测 出 任务 的 
运行 时 间 表 ， 并 利用 该 时 间 表 对 任务 进行 排序 。 假 设 弱 实时 任务 的 时 间 表 是 给 定 
的 ， 在 细 化 阶段 评估 该 任务 的 热效应 。 在 某 个 给 定 的 时 刻 ， 存 在 两 种 任务 类 型 ， 
一 种 是 当前 般 入 式 系统 正在 运行 的 任务 ( 称 之 为 当前 任务 ) ， 另 一 种 是 其 他 正在 
计划 调度 的 任务 〈 称 之 为 未 来 任务 ) 。 在 每 个 调度 时 间 间 隔 ， 调 度 句 旨 在 优化 接 
下 来 的 任务 调度 。 假 定 未 来 任务 预测 的 运行 时 间 以 及 其 对 应 的 预测 稳 态 温度 ， 确 
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定 该 任务 的 最 高 初始 温度 中 。, ， 基 于 该 最 高 初始 温度 开始 启动 运行 该 任务 ， 并 且 
在 任务 结束 时 不 会 超过 温度 的 国 值 。 为 了 满足 该 约束 条 件 ， 还 可 以 调整 当前 任务 
的 工作 电压 和 频率 以 帮助 将 未 来 任务 的 初始 温度 带 回 到 期 望 的 水 平 。 类 似 地 ， 也 
可 以 调整 未 来 任务 的 电压 和 频率 设置 ， 使 得 在 完成 当前 任务 时 的 温度 作为 其 初始 
温度 ， 并 从 该 初始 温度 开始 到 该 未 来 任务 结束 ， 不 会 超过 最 大 允许 的 温度 限制 。 
同时 ， 弱 实时 任务 调度 器 可 以 识别 出 系统 中 可 利用 的 任何 温度 余 量 。 如 果 正 在 被 
调度 的 未 来 任务 在 完成 时 其 温度 低 于 最 高 温度 限制 ， 则 将 相应 的 温度 余 量 中 继 给 
负责 “尽力 而 为 ”任务 的 第 二 调度 器 分 量 。 利 用 该 信息 ,“ 尽 力 而 为 ”调度 器 可 
以 调整 不 同 任务 的 优先 级 。 具 体 来 说 ， 它 将 “尽力 而 为 ”任务 分 为 两 种 类 型 ， 
冷 任务 和 热 任 务 。 冷 任务 是 那些 不 会 超过 当前 安排 的 下 一 组 任务 设 定 的 目标 Treg 
的 任务 ， 而 热 任务 是 那些 不 能 满足 7 目标 的 任务 。“ 尽 力 而 为 ”调度 絮 则 在 以 
轮换 交替 的 方式 拆 分 热 任 务 和 冷 任务 之 间 运 行 时 间 的 分 配 。 最 初 为 每 个 任务 分 配 
一 个 CPU 资源 份额 ， 然 后 运行 队列 将 被 拆 分 为 “ 冷 任务 ” 集 和 “ 热 任 务 ” 集 。 
在 线 调 度 絮 从 具有 最 小 CPU 份额 的 “ 冷 任务 ”集合 中 选择 任务 ， 并 旦 类似 地 从 
具有 最 小 CPU 份额 的 “ 热 任 务 ” 人 和 集合 中 选择 任务 。 通 过 预测 每 个 单独 任务 的 热 
影响 ， 可 以 使 用 一 个 在 0 ~1 范围 内 的 参数 调节 CPU 份额 。 对 于 “尽力 而 为 ” 任 
务 ， 最 好 在 固定 的 电压 和 频率 设置 条 件 下 执行 这 些 任务 。 如 果 在 该 设置 下 “ 热 
任务 ”接收 的 CPU 份额 低 于 最 低 共 享 份额 限制 (此 限制 由 调度 系统 决定 )， 则 
运行 时 系统 才 会 考虑 其 他 额外 的 公平 性 措施 。 该 任务 的 CPU 份额 随 着 其 电压 和 
频率 设置 的 相应 调节 比例 而 增加 ， 使 得 该 任务 仍然 可 以 被 调度 ， 但 性 能 较 低 ， 且 
保持 在 温度 阔 值 以 内 。 

最 后 ， 与 能 入 式 系统 相关 的 另 一 种 类 别 是 分 布 式 计算 系统 。 这 项 研究 模拟 了 
由 各 种 异 构 处 理 单元 (例如 ，CPU，FPGA，DSP) 组 成 的 分 布 式 嵌入 系统 [22] , 
在 本 研究 中 已 经 使 用 了 与 上 述 系 统 类 似 的 热 模型 31 1。 该 项 研究 新 的 一 个 方面 是 
分 布 式 和 衣 人 系统 中 的 每 个 处 理 单元 都 对 其 自己 的 内 置 温度 传感器 进行 采样 ， 并 通 
过 公共 通信 息 线 定期 将 其 广播 给 所 有 其 他 处 理 单元 ， 每 个 处 理 单元 维护 分 布 式 系 
统 中 所 有 处 理 单元 的 温度 排序 列表 。 当 一 个 处 理 单元 遇 到 热 紧 急事 件 时 ， 它 通过 
“握手 信号 ”启动 与 其 列表 中 温度 最 低 的 处 理 单元 的 沟通 协商 ， 并 请 求 与 温度 最 
低 的 处 理 单元 交换 其 工作 负载 。 在 随后 的 时 间 段 中 ， 进 行 数据 的 传输 以 便 在 处 理 
单元 之 间 交 换 数 据 ， 并 且 每 个 处 理 单 元 恢复 执行 其 他 处 理 单元 的 调度 。 在 数据 传 
输 期 间 ， 处 理 单元 可 能 会 错过 其 分 配 到 的 实时 任务 的 截止 时 间 ， 这 可 以 通过 允许 
具有 最 早 开始 时 间 (或 截止 时 间 ) 的 任务 将 通信 媒介 用 于 其 数据 传输 来 缓解 。 
总 的 来 说 ， 这 种 方法 提供 了 一 种 切实 可 行 的 途径 来 共同 管理 热 约束 和 任务 的 迁移 
开销 ， 以 保持 在 该 戏 入 式 系 统 中 执行 任务 的 实时 截止 时 间 。 
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虚拟 化 是 一 个 强大 的 工具 ， 其 允许 通过 大 规模 系统 中 的 多 种 操作 系统 实现 对 
大 量 物理 计算 资源 的 高 性 价 比 和 无 缝 共享 [3,M] 。 从 专业 服务 器 的 实现 可 以 看 
出 ， 虚 拟 化 已 经 在 数据 中 心 和 其 他 高 性 能 计算 平台 中 的 服务 器 系统 上 被 广泛 使 
用 ， 并 取得 了 非常 大 的 成 功 。 虚 拟 化 还 可 用 于 双 操 作 系统 的 桌面 计算 ， 通 常用 于 
Windows 和 Linux 双 操 作 系 统 主机 。 

虽然 单个 系统 的 物理 资源 (如 处 理 器 资源 、 内 存 资源 、L/O 资源 以 及 网 络 资 
源 ) 由 其 操作 系统 进行 管理 , 但 是 在 虚拟 化 系统 中 ， 部 署 了 一 个 额外 的 附加 层 
来 监督 物理 资源 的 管理 ， 该 附加 层 称 为 虚拟 机 监视 器 (VMM)。VMM 协调 本 地 
操作 系统 与 物理 资源 之 间 的 访问 ， 每 个 都 具有 特定 的 接口 需求 。 

虚拟 机 监视 器 提供 了 一 种 合适 的 媒介 ， 使 得 诸如 任务 迁移 和 负载 均衡 的 方法 
变 得 更 加 便捷 简单 ， 而 任务 迁移 和 负载 均 衔 在 全 系统 范围 内 与 任务 活动 量 、 器 件 
功 耗 以 及 能 量 消耗 的 均匀 一 致 性 高 度 相 关 。 认 识 到 这 一 机 会 ， 再 加 上 对 数据 中 心 
和 其 他 大 规模 高 性 能 计算 集群 的 能 量 和 热 分 布 优化 的 迫切 需求 ， 导 致 了 将 热 感 知 
纳入 到 虚拟 化 工具 的 兴趣 越 来 越 高 。 

该 项 研究 比较 和 评估 了 虚拟 机 的 迁移 对 比 高 


性 能 计算 系统 中 基于 热管 理 的 电压 和 频率 调整 所 Eu 
带 来 的 好 处 [5] 。 系 统 级 热管 理 方法 被 设计 成 一 种 
四 层 相互 影响 的 抽象 化 结构 ， 如 图 5.6 所 示 。 "m 
抽象 化 结构 的 最 高 层 代表 数据 中 心 的 用 户 以 I, LANI 
及 它们 的 应 用 程序 和 工作 负载 ， 这 一 层 的 主要 性 oe 
能 指标 是 QoS。 第 二 层 表 示 作 为 访问 数据 中 心 首 
要 机 制 的 虚拟 化 层 ， 诸 如 VMM 的 迁移 和 负载 均 SOS LIEN 
衡 发 生 在 这 一 层 ， 并 且 将 从 数据 中 心 的 性 能 和 能 D 
量 消耗 以 及 随后 其 运行 成 本 的 角度 来 衡量 虚拟 化 一 一 NN 
的 成 功 与 否 。 第 三 层 对 应 于 计算 系统 的 物理 资源 ， n 
对 于 系统 的 功 耗 和 热管 理 ， 诸 如 动态 电压 和 频率 FERAE ERO, V 
调节 、 处 理 器 和 /或 核心 的 功 耗 封顶 技术 以 及 门 控 


时 钟 等 技术 可 用 于 此 层 。 该 抽象 结构 的 最 底层 表 

示 数 据 中 心 的 物理 环境 ， 包 括 : 中 制冷 系统 ; 图 5.6 数据 中 心中 功 耗 及 热管 理 
@ 跟 踪 芯 片 、 机 架 、 机 柜 以 及 机 房 包 间 内 热 状 态 系统 相互 影响 的 抽象 层 系统 视图 
的 温度 传感器 系统 ; @ 机 柜 的 摆 放 位 置 以 及 机 房 中 对 应 的 冷 量 分 布 等 。 
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本 研究 中 ， 在 虚拟 化 层 运 用 了 几 种 不 同 的 系统 热管 理 方法 !5] 。 首 先 ， 系 统 
通过 任务 迁移 对 温度 紧急 情况 做 出 响应 ， 该 温度 通过 温度 传感器 上 报 给 系统 ， 其 
主要 目的 是 大 幅度 减少 热点 位 置 CPU 的 活动 量 ， 这 主要 是 通过 迁移 产生 热点 服 
务 器 上 托管 的 虚拟 机 (VM). 以 及 在 这 些 物理 资源 上 运行 的 所 有 应 用 程序 来 实现 
的 ， 这 些 迁 移 可 以 因为 不 同 的 原因 而 引发 ， 并 由 此 产生 不 同 大 小 规模 的 迁移 。 例 
如 ， 根 据 处 于 活动 状态 的 服务 器 是 否 做 好 接收 被 迁移 组 件 的 准备 ， 或 者 处 于 休眠 
状态 的 服务 器 是 否 需 要 被 唤醒 启动 ， 热 干预 造成 的 开销 及 其 对 性 能 的 影响 将 会 有 
所 不 同 。 此 外 ， 迁 移 的 应 用 程序 在 目标 服务 器 上 创建 资源 争夺 的 程度 将 决定 目标 
服务 器 的 性 能 下 降 程度 。 在 没有 服务 器 能 够 承受 因 迁 移 引 起 的 额外 热 应力 的 极端 
条 件 下 (这 些 服务 器 可 能 已 经 在 温度 阔 值 附近 运行 ， 或 者 可 以 预测 因 迁 移 而 造 
成 的 温度 影响 ) ， 温 度 高 的 服务 器 可 能 会 被 简单 地 暂停 运行 以 减缓 系统 的 热量 积 
累 ， 并 一 直 等 到 目标 服务 器 可 用 。 

虚拟 机 监视 器 (VMM) 应 用 于 热管 理 的 一 个 方面 是 将 虚拟 的 CPU 分 配给 实 
际 物 理 的 CPU，VMM 可 以 基于 CPU 利用 率 和 性 能 来 确定 两 者 之 间 的 映射 关系 。 
另 一 方面 ， 通 过 设置 亲 和 性 关系 (也 称 为 钉 扎 关系 )， 某 些 选 定 的 虚拟 CPU 也 可 
以 被 明确 地 分 配给 特定 的 物理 CPU， 如 果 已 经 知道 某 些 特殊 工作 负载 可 以 在 该 
操作 中 获 益 。 通 常 这 主要 是 用 来 利用 数据 的 本 地 性 。 在 该 项 研究 中 ， 已 经 提出 使 
用 钉 扎 关 系 作 为 保护 经 受热 应 力 CPU 的 手段 。 具 体 来 说 ， 虚 拟 机 (VM) 被 固定 
在 其 他 CPU E, 防止 它们 迁移 到 受 保护 的 那些 CPU, ， 使 得 这 些 CPU 的 本 地 热管 
理 机 制 可 以 降低 它们 的 工作 频率 并 减轻 它们 经 受 的 热 应 力 ， 而 无 须 托管 的 VM um 
iB CPU 以 高 频率 运行 来 满足 QoS 的 要 求 。 另 一 方面 ， 必 须 注 意 的 是 ， 这 将 加 剧 
那些 受 固 CPU 的 活动 负载 。 有 其 他 研究 指出 ， 对 于 任务 管理 的 系统 级 干预 应 该 
避免 在 CPU 的 一 个 核心 上 引起 过 度 活 动 的 缺陷 ， 从 而 阻碍 了 该 CPU 上 的 所 有 核 
心 运 行 在 真正 的 峰值 频率 之 下 ， 因 为 大 多 数 CPU 仍然 会 部 署 芯片 层 的 时 钟 和 电 
压 调节 机 制 !36] 。 

OS 和 VMM 层面 的 热管 理 方案 显示 出 独一无二 的 机 会 ， 因 为 它们 可 以 访问 
有 关 工 作 负 载 、QoS、 截 止 时 间 、 优 先 级 等 信息 。 然 而 ， 它 们 需要 克服 接口 间 的 
障碍 ， 响 应 时 间 可 能 是 一 个 限制 因素 。 一 项 研究 探索 了 边界 以 便 寻 找 薄 虚拟 层 ， 
该 虚拟 层 不 一 定 是 操作 系统 的 一 部 分 ， 而 是 一 个 与 VMM 和 底层 硬件 密切 相连 的 
实体 [0371 。 该 虚拟 层 被 称 为 虚拟 热管 理 器 (Virtual Thermal Manager, VTM), 
VMM 用 于 传递 工作 负载 信息 ， 并 周期 性 地 (每 10ms) 调用 和 和 暂停 VTM， 但 是 
VTM 对 操作 系统 不 可 见 。VTM 收集 温度 传感器 的 数据 ， 并 维护 系统 中 活动 线程 
的 历史 温度 列表 ， 同 时 它 还 维护 VMM 的 线程 与 处 理 器 核心 的 分 配 信 息 。 通 过 存 
储 每 个 活动 线程 的 所 有 温度 传感器 的 最 近 两 个 时 刻 温度 数据 来 维持 线程 属性 和 热 
行为 之 间 的 详细 关联 性 数据 。VTM 还 评估 芯片 核心 之 间 的 温度 梯度 以 及 核心 的 
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峰值 温度 。 在 检测 到 两 个 核心 之 间 的 温度 梯度 大 于 设 定 的 阔 值 时 ，VTM 便 启 动 
线程 的 迁移 。 这 种 VTM 管理 机 制 还 进一步 得 到 了 扩展 ， 具 有 执行 架构 重新 配置 
的 功能 ， 例 如 发 布 性 能 钳制 、 减 小 发 布 的 宽度 、 和 撤销 发 布 宽度 。 

用 于 多 核心 系统 的 热管 理 方案 通常 追求 不 同类 型 的 任务 活动 迁移 ， 以 便 在 整 
个 系统 内 (一 个 芯片 或 者 多 台 服 务 器 ) 达到 更 好 的 热量 分 布 效果 。 虽 然 客 户 端 
的 操作 系统 使 用 它们 自己 的 策略 进行 任务 活动 的 迁移 ， 但 是 在 虚拟 化 的 情况 下 ， 
VMM 还 将 借助 额外 的 措施 来 管理 系统 的 热平衡 。 多 个 虚拟 CPU 和 VMM 策略 之 
间 的 潜在 冲突 ， 以 及 虚拟 CPU 管理 其 当前 分 配 的 物理 资源 的 温度 的 困难 已 经 得 
到 进一步 的 研究 '”3,3”]。 主 要 有 两 种 方法 可 以 平衡 系统 功 耗 防止 过 早产 生 热 点 
或 者 经 常 产 生 热点 。 第 一 种 方法 是 将 虚拟 CPU 上 的 任务 在 相同 的 物理 资源 范围 
内 从 一 个 核心 迁移 到 另 一 个 核心 ， 该 方法 同样 适用 于 非 虚拟 化 的 系统 。 这 项 特别 
的 研究 还 提出 了 第 二 种 方法 ， 即 在 一 个 虚拟 CPU 上 运行 的 线程 与 另 一 个 虚拟 
CPU 进行 交换 。 这 需要 对 每 个 虚拟 CPU 的 功 耗 进 行 细 颗 粒度 的 预测 ， 该 预测 需 
要 足够 的 频繁 以 便 能 够 捕获 虚拟 CPU 功率 高 度 地 随时 间 变 化 的 特性 ， 因 为 CPU 
能 够 在 多 个 时 间 段 内 执行 多 个 客户 端的 操作 系统 ， 这 些 操作 系统 的 行为 又 各 不 相 
同 。 问 题 是 VMM 在 某 种 程度 上 了 解 当 前 执行 的 以 及 历史 上 执行 的 任务 ， 但 是 下 
一 个 要 执行 的 任务 分 别 由 每 个 客户 端的 操作 系统 决定 。 因 此 ， 在 该 项 特别 的 研究 
中 ， 提 出 了 一 种 迁移 策略 ， 该 策略 随 着 其 对 应 的 功率 和 温度 预测 进行 更 新 ， 同 时 
策略 更 新 速度 比 客户 端 操作 系统 调度 线程 的 节奏 更 快 。 该 研究 使 用 了 性 能 计数 器 
的 方法 来 预 估 温 度 和 功 耗 ， 认 为 基于 热 二 极 管 的 温度 传感器 不 能 以 所 需 频率 进行 
采样 并 更 新 当前 温度 。 通 过 使 用 最 新 一 代 的 内 置 温度 传感器 ， 这 种 限制 可 以 很 容 
易 地 被 克服 ， 并 且 新 一 代 的 温度 传感器 可 以 提供 高 频率 的 温度 采样 。 

假设 存在 一 种 机 制 ， 可 以 估算 出 虚拟 CPU 所 消耗 的 功率 以 及 其 温度 状态 。 
从 广义 上 讲 ， 热 平衡 问题 将 归结 为 识别 出 功率 消耗 最 高 的 虚拟 CPU， 并 将 其 物 
理 资源 与 功率 消耗 最 低 的 虚拟 CPU 进行 交换 。 基 于 该 理论 框架 ， 定义 了 两 种 主 
要 的 迁移 类 型 : 节点 内 迁移 和 节点 间 迁 移 。 节 点 内 迁移 不 涉及 VMM 的 任何 位 置 
变动 ， 只 有 客户 端 操作 系统 与 物理 资源 之 间 的 映射 关系 通过 VMM 动态 地 改变 ， 
并 对 客户 端 操作 系统 保持 透明 。 当 执行 节点 间 迁 移 时 ，VMM 也 被 重新 定位 到 目 
标 节点 。 已 经 对 该 基本 框架 进行 了 各 种 优化 ， 从 而 实现 以 更 经 济 有 效 的 方式 进行 
频繁 的 迁移 。 这 些 优化 方法 之 一 就 是 批 处 理 迁移 ， 以 便 处 理 虚拟 CPU 可 以 从 大 
量 客户 端 应 用 程序 中 执行 大 量 线程 迁移 的 情况 ， 并 且 这 些 应 用 程序 正在 虚拟 
CPU 上 运行 。 这 就 表明 ， 并 非 每 个 虚拟 CPU 迁移 都 会 涉及 相同 数量 的 线程 。 在 
线程 集合 较 大 的 情况 下 ， 环 境 已 经 扩展 了 一 个 用 户 级 调度 器 ， 该 调度 器 能 够 在 一 
次 尝试 中 迁移 多 个 线程 。 


硬件 虚拟 化 的 概念 也 适用 于 其 他 类 型 的 系统 ， 其 中 一 个 例子 就 是 片上 网 络 
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(NoC) 处 理 单元 (PE) 的 虚拟 化 [4] 。 一 个 NoC 由 一 个 与 路 由 器 互 连 的 PE 的 
集合 组 成 ， 如 图 5.7 所 示 。 每 个 物理 PE 都 可 以 被 虚拟 化 以 负责 多 个 处 理 任务 ， 
并 通过 上 下 文 切 换 在 它们 之 间 进 行 协调 。 
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图 5.7 片上 网 络 架 构 的 抽象 说 明 图 
a) 大 多 数 NoC 被 设计 成 PE 的 规则 阵列 ， 每 个 PE 均 具 有 本 地 路 由 器 ， 以 管理 各 PE 间 的 通信 
b) 路 由 器 执行 特殊 的 算法 以 将 输入 数据 包 转 发 到 特定 的 输出 端口 ， 如 图 所 示 输 入 数据 包 可 以 得 到 缓冲 


在 NoC 的 背景 下 ， 虚 拟 化 的 一 个 有 趣 方面 是 通信 成 本 的 变化 ， 这 取决 于 映 
射 到 物理 PE。 通 信 延迟 不 仅 是 各 PE 互联 的 函数 ， 是 相对 稳定 的 ， 而 且 还 是 路 由 
器 数量 的 函数 ， 数 据 包 需 要 从 路 由 器 中 穿 过 ， 这 部 分 却 是 高 度 可 变 的 。 路 由 路 径 
中 的 这 种 变化 会 影响 通信 所 消耗 的 能 量 ， 这 对 于 NoC 是 很 重要 的 一 部 分 。 考 虑 
到 这 些 效应 ， 该 研究 引入 了 遗传 算法 ， 以 增强 PE 虚拟 化 和 任务 布置 的 热 识别 功 
能 [41 。 物 理 PE 的 虚拟 化 和 作为 虚拟 PE 的 逻辑 计算 任务 的 布置 由 二 进 制 编码 遗 
传 算法 的 初始 随机 解 集 表 示 ， 该 解 集 包 括 了 遗传 算法 的 初始 种 群 ， 每 个 解 通过 适 
应 度 函 数 进行 评估 ， 这 有 助 于 评估 每 个 染色 体 编 码 〈 即 解 ) 的 存活 机 会 。 在 这 
种 情况 下 ， 适 应 度 函 数 表示 温度 分 布 的 均匀 性 ， 其 与 热点 经 历 的 峰值 温度 有 关 ， 
量化 的 适应 度 函 数 表 达 式 见 式 (5.12) , BED PE 的 位 置 与 其 代表 性 温度 有 关 ， 
并 通过 编码 具有 给 定 的 任务 分 配 。 在 PE 单元 的 +xt 区域 内， 计算 出 所 有 PE 的 
温度 之 和 ， 适 应 度 函 数 定 义 如 下 : 


1 
MAX(S,,, | Vt x t regions) 


整个 +xt 区 域内 所 有 PE 温度 之 和 最 大 值 的 倒数 定义 为 该 染色 体 的 适应 度 ， 
txt 区 域 表 示 整 个 NoC 沿 横向 尺 二 方向 上 强 热 耦 合 的 范围 。 遗 传 算法 通过 两 种 机 


(5.12) 
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制 来 演化 出 初始 解 的 种 群 : 杂交 机 制 和 变异 机 制 。 通 过 杂交 ， 产 生 两 个 染色 体 的 
后 代 ， 每 个 染色 体 都 具有 一 定 的 概率 发 生 杂 交 。 变 异 可 以 通过 随机 的 交换 或 者 移 
位 来 实现 ， 其 具有 预定 义 的 发 生 概 率 。 这 些 参 数 的 调整 对 于 遗传 算法 的 成 功 至 关 
重要 。 种 群 的 大 小 是 另 一 个 参数 ， 其 以 相反 的 方式 影响 遗传 算法 的 最 终 质量 和 总 
的 运行 时 间 。 最 后 ， 需 要 定义 终止 标准 ， 可 以 是 迭代 总 步 数 也 可 以 是 适应 度 函 数 
中 期 望 改善 增 量 的 最 小 值 。 


5.4 应 用 层 在 温度 分 布 形成 中 的 作用 


应 用 程序 驱动 计算 系统 的 特性 清晰 地 塑造 了 底层 系统 的 热 状态 。 用 户 以 及 他 
们 要 求 的 应 用 程序 共同 定义 了 系统 的 性 能 期 望 以 及 QoS 等 级 ， 这些 衡量 指标 决 
定 了 计算 系统 的 功率 密度 ， 并 且 还 影响 用 户 服务 供应 商 、 制 造 商 生态 系统 的 经 济 
动态 。 

热 感知 技术 已 经 渗透 到 系统 中 抽象 化 结构 的 最 高 层 ， 包 括 编译 器 、 工 作 负载 
管理 、 数 据 中 心中 设备 特征 等 ， 从 热管 理 的 角度 已 经 提出 了 各 种 编码 优化 和 分 析 
方法 。 一 项 早期 研究 评估 了 现 有 的 源 代码 转换 ， 以 量化 其 热 影响 Wm]。 根 据 评估 
中 的 观察 结果 ， 制 定 了 一 些 关 于 热 感知 编译 流程 的 指导 方针 。 微 控制 器 用 于 收集 
功率 测量 值 ， 同 时 微 控 制 占 的 平面 布局 被 分 割 成 块 状 结构 的 分 布 ， 该 块 状 分 布 被 
转换 成 等 效 热电 路 以 便 把 功率 测量 值 转换 成 控制 器 的 温度 。 同 时 ， 块 状 结构 的 利 
用 率 统计 数据 用 来 推导 出 功率 和 功能 单元 利用 率 之 间 的 关系 。 图 像 过 滤 基 准 程序 
已 经 被 作为 案例 进行 研究 ， 其 在 舰 入 式 系统 的 活动 和 热 应 力 方 面具 有 代表 性 。 在 
本 研究 中 ， 比 较 了 三 种 不 同 的 代码 转换 ， 分别 是 循环 分 割 、 动 态 内 存 分 配 和 循环 
流水 线 。 循 环 分 割 技术 将 一 个 循环 分 解 成 多 个 循环 ， 这 些 循环 在 原始 循环 的 不 同 
子 范围 内 进行 迭代 ， 使 得 可 以 消除 主 循环 中 的 一 些 依赖 性 以 提高 性 能 。 可 以 使 用 
编译 需 指 令 执行 动态 内 存 分 配 ， 以 在 运行 时 优化 数据 的 本 地 性 。 循 环流 水 线 包 括 
循环 体 中 指令 的 重新 排序 以 及 依赖 性 管理 ,使 得 可 以 同时 进行 最 大 步 数 的 迭代 。 

从 两 个 角度 评估 了 这 些 针对 编译 器 优化 的 影响 : 中 系统 的 总 峰值 温度 ; @ 处 
理 带 不 同 区 块 之 间 的 局 部 温度 梯度 。 研 究 发 现 ， 改 善 执 行 时 间 的 优化 方法 通常 对 
峰值 温度 具有 积极 的 影响 ， 因 为 系统 中 的 任务 活动 运行 的 时 间 变 得 更 短 ， 并 且 不 
人 允许 温度 有 显著 的 上 升 。 与 基准 情况 相 比 ， 尽 管 循环 流水 线 技术 使 系统 功 耗 有 所 
降低 ， 但 是 峰值 温度 变 得 更 高 ， 这 支持 了 过 去 其 他 几 项 研究 的 论点 ， 指 出 除了 在 
功率 最 小 化 外 还 需要 对 热 感知 技术 进行 优化 ， 因 为 最 小 总 功率 并 不 总 是 对 应 于 最 
小 功率 密度 .天 8] 。 对 温度 梯度 的 研究 揭示 出 了 对 编译 器 和 应 用 程序 行为 影响 的 
更 多 理解 ， 这 个 研究 评估 了 两 个 温度 梯度 相关 的 衡量 指标 名 ] ， 即 处 理 器 上 所 有 
两 个 区 块 之 间 的 最 大 温度 差 和 处 理 需 上 所 有 两 个 区 块 之 间 的 典型 温度 梯度 。 两 个 
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区 块 之 间 的 最 大 温度 差 有 助 于 推导 出 必 片 经 受 的 期 望 热 循环 和 热 应 力 。 在 这 项 研 
究 中 ， 循 环流 水 线 技术 可 以 揭示 出 最 大 的 温度 梯度 ， 其 发 生 在 寄存 器 文件 和 累加 
寄存 带 之 间 ， 其 中 存储 了 中 间 计 算 步 又 的 结果 。 在 流水 线 循环 执行 过 程 中 ， 跨 存 
储 空间 的 剧烈 过 渡 在 寄存 器 文件 中 执行 特殊 的 寄存 顺 ， 这 将 会 引起 明显 的 热点 ， 
以 及 相对 于 芯片 其 他 部 分 会 引起 温度 的 大 振荡 。 

早期 的 关于 热 感知 编译 吉方 法 的 一 个 重点 是 将 计算 拟 合成 非常 大 的 指令 字 功 
能 单元 "1 ， 研 究 人 员 已 经 知道 该 功能 单元 经 常 产生 芯片 热点 。 该 方法 以 平衡 的 
方式 在 功能 单元 中 引入 针对 编译 吉 的 任务 调度 ， 使 得 它们 的 功率 密度 分 布 也 是 均 
勺 的， 功能 单元 的 温度 需要 在 整个 流程 的 早期 阶段 做 近似 的 估算。 在 本 研究 中 ， 
通过 每 个 指令 的 近似 功 耗 P， 以 及 底层 硬件 的 三 个 物理 参数 ( 即 芯 片 核心 的 厚度 
t、 硅 片 的 热传导 系数 x、 功 能 单元 的 面积 4) 可 近似 地 得 出 芯片 上 热 耦 合 区 块 的 


温度 : 


Try =P (5. 13) 
进而 ， 两 个 相 邻 功能 单元 之 间 的 热 扩 散 如 下 : 
H( FU, ,FU,) =s(T, - T,) (5.14) 


假设 所 有 的 功能 单元 所 占据 的 面积 是 相同 的 ， 并 且 整 个 芯片 的 材料 属性 也 是 
相同 的 ， 通 过 式 (5.13) 和 式 (5.14) 会 发 现 ， 两 个 相 邻 的 功能 单元 之 间 的 热 
扩散 与 两 者 之 间 的 功率 差 值 成 正比 ， 因 此 优化 目标 可 以 表示 为 平衡 功能 单元 间 的 
功率 密度 。 因 为 所 有 的 功能 单元 具有 相同 的 面积 ， 这 样 进一步 简化 为 每 个 功能 
元 的 动态 功率 ， 这 可 以 通过 开发 一 个 编译 器 劳 路 来 修改 算法 指令 的 初始 性 能 驱动 
调度 来 实现 。 这 里 所 提 到 的 编译 器 旁 路 首先 评估 高 性 能 调度 条 件 下 每 个 功能 单元 
的 总 开关 功率 ， 同 时 还 通过 所 有 功能 单元 的 总 功率 除 以 总 功能 单元 数 来 计算 在 理 
想 的 平衡 条 件 下 每 个 功能 单元 的 平均 开关 功率 ， 其 主要 的 思想 是 努力 为 每 个 功能 
单元 实现 这 种 理想 的 功率 水 平 。 编 译 器 根据 功能 单元 所 消耗 的 功率 大 小 为 其 排 
序 ， 并 寻找 将 计算 任务 从 功率 消耗 最 高 的 单元 重新 调度 到 功率 消耗 最 低 的 单元 的 
机 会 。 只 有 当 依 赖 性 约束 条 件 依然 满足 时 ， 才 人 允许 重新 进行 调度 。 考 虑 到 因 温 度 
引发 的 漏电 功 耗 ， 通 过 IPC 调谐 技术 ， 该 方法 也 得 到 了 扩展 。 这 里 指 的 是 程序 阶 
段 ， 其 中 IPC 低 于 系统 中 功能 单元 的 数量 。 基 于 此 ， 可 以 对 一 小 部 分 功能 单元 进 
行 功率 门 控 以 降低 其 漏电 功率 。 这 种 基本 技术 是 在 编译 器 方案 中 定制 的 ， 以 避免 
在 基本 区 块 的 大 量 迭代 中 或 者 在 多 个 IPC 调谐 循环 中 保持 相同 的 几 个 功能 单元 处 
于 活动 状态 。 这 是 通过 以 一 定 的 循环 迭代 粒度 或 者 当代 码 从 一 个 循环 过 渡 到 下 一 
个 循环 时 不 停 地 轮换 功 耗 门限 和 活动 状态 的 功能 单元 来 实现 的 。 

针对 高 性 能 计算 系统 ， 已 经 提出 了 用 于 并 行 编码 的 代码 分 析 框 架 ， 以 识别 出 
洪 在 的 冷却 瓶颈 !S] 。 该 软件 工具 利用 芯片 内 置 的 温度 传感器 将 实时 测量 到 的 温 
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度 值 与 计算 程序 关联 在 一 起 。 这 样 一 种 工具 可 以 有 效 地 确定 并 行 编码 中 的 具体 位 
置 ， 也 可 以 从 热 感知 技术 优化 中 获得 最 大 的 益处 。 许 多 高 性 能 的 计算 应 用 程序 由 
开发 人 员 精 心 手动 调试 以 实现 其 性 能 ， 因 此 ， 在 设计 过 程 中 可 以 接受 程序 设计 者 
的 重要 输入 。 在 同一 框架 内 ,程序 开发 人 员 可 以 被 引 向 (或 者 远离 ) 用 于 热管 
理 的 某 些 优化 选项 。 此 外 ， 这 种 工具 可 以 帮助 在 大 规模 系统 的 测试 集群 中 不 同 机 
器 之 间 测 试 给 定 并 行 编码 的 行为 。 从 广义 上 来 讲 ， 该 分 析 工 具 只 是 从 功能 的 角度 
对 程序 进行 了 监控 ， 并 在 整个 功能 的 执行 期 间 收集 温度 传感器 的 一 些 温 度数 据 ， 
然后 分 析 工 具 将 功能 时 间 截 映射 到 温度 数据 。 

回顾 对 热管 理 的 需求 以 及 未 来 趋势 ， 多 种 编译 技术 (例如 资源 休眠 和 空间 
调度 ) 已 经 被 提出 用 于 功率 、 能 源 和 热管 理 !%] 。 面 向 编译 器 的 指令 调度 技术 可 
以 帮助 其 赞成 或 者 反对 某 些 资源 的 占 空 比 ， 以 避免 它们 的 任务 活动 发 生 重 盔 或 者 
允许 系统 足够 长 的 空闲 时 间 以 在 睡眠 模式 中 去 除 累 积 的 热量 。 类 似 地 ， 空 间 调度 
可 以 考虑 到 物理 资源 之 间 的 热 耦 合 ， 并 扩展 传播 系统 指令 的 调度 ， 使 得 利用 热 耦 
合资 源 的 那些 调度 在 其 执行 时 间 间 隔 内 具有 最 小 的 重症 。 

两 个 最 为 突出 的 编译 器 优化 ， 即 寄存 器 分 配 优化 和 循环 展开 优化 。 这 两 种 优 
化 技术 在 其 发 展 中 均 已 考虑 了 对 温度 的 影响 9] 。 其 主要 思想 是 通过 利用 循环 展 
开 技术 以 相同 的 方式 在 多 个 寄存 器 之 间 扩 展 任务 访问 活动 。 现 已 推导 出 一 个 高 水 
平 热 成 本 模型 ， 通 过 热传导 的 方式 ， 将 寄存 器 的 使 用 情况 与 该 寄存 如 以 及 物理 空 
间 上 相 邻 的 寄存 器 的 温度 预期 关联 起 来 。 对 于 给 定 的 寄存 器 分 配 ， 预 佑 每 个 寄存 
器 的 稳 态 温度 。 然 后 ， 把 寄存 器 分 为 两 种 类 型 : 高 温 寄 存 器 和 低温 寄存 器 。 预 佑 
温度 高 于 某 一 限 值 的 那些 被 划分 为 高 温 寄存 器 ， 然 后 利用 循环 展开 技术 重新 分 配 
这 些 寄存 占 的 任务 活动 。 对 于 每 个 内 部 循环 ， 寻 求 当 前 未 被 该 循环 利用 的 一 组 替 
代 寄 存 器 。 从 温度 最 高 的 寄存 器 开始 ， 然 后 将 温度 变量 移动 到 这 些 备 用 的 寄存 器 
位 置 。 每 次 在 循环 中 应 用 新 的 展开 时 ， 都 以 这 种 方式 执行 寄存 器 分 配 。 

对 高 性 能 计算 工作 负载 的 详细 评估 由 在 根据 每 个 应 用 程序 的 行为 建立 具体 的 
导 方针 ， 并 从 以 应 用 为 中 心 的 角度 调整 系统 的 功率 和 热管 理 '*] 。 通 过 对 不 同 
子 系统 的 行为 和 阶段 进行 分 解 并 对 其 工作 负载 进行 分 析 ， 将 有 助 于 更 好 地 评估 给 
定子 系统 对 于 给 定 工作 负载 的 重要 性 。 对 于 给 定 的 工作 负载 ， 可 以 估算 节能 策略 
(比如 低 功率 模式 、P - States 模式 ) 的 有 效 性 ， 并 且 可 以 适当 地 仅 适 用 于 在 功率 
和 能 量 方面 相应 的 那些 子 系统 。 对 于 L/O 密集 型 应 用 ，CPU 的 利用 率 远 低 于 其 
他 目标 应 用 ， 在 这 些 应 用 中 总 有 可 能 选择 频率 范围 更 低 的 P - States 模式 。 对 于 
其 他 一 些 工 作 负载 ， 网 卡 具 有 茶 些 特殊 的 突 发 活动 ， 而 在 这 些 突 发 活动 的 时 间 段 
内 系统 的 其 他 地 方 (其 他 子 系统 ) 处 于 空闲 模式 。 工 作 负 载 中 的 同步 强度 影响 
H CPU, 1/0 和 内 存 的 利用 率 。 基 于 这 些 评估 和 开关 每 个 子 系统 〈 或 频率 上 升 / 
下 降 ) 的 成 本 考量 ， 功 耗 的 相对 收益 使 用 高 级 模型 进行 评估 。 在 运行 时 ， 这 个 
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模型 还 可 以 在 预测 和 动态 功 耗 管理 方案 中 找到 用 途 。 


5.5 数据 中 心 和 超级 计算 机 的 热 感知 优化 


用 于 设备 冷却 的 费用 是 一 个 设计 良好 的 数据 中 心 第 二 大 费用 支出 ， 占 整个 电 
费 总 支出 的 30% ~50% 。 典 型 数据 中 心中 的 冷却 系统 在 基本 功能 方面 类 似 于 世 
片 和 板 级 上 使 用 的 冷却 技术 ， 在 数据 中 心 的 各 个 楼 层 或 机 房 包 间 内 大 量 使 用 了 强 
迫 空气 冷却 以 及 液 - 液 冷 却 。 数 据 中 心中 的 水 冷 系 统 或 者 部 署 冷 水 机 组 可 以 从 中 
央 冷 却 塔 主动 通过 水 泵 输送 低 于 环境 温度 的 冷却 水 ， 或 者 在 无 冷水 机 组 系统 中 使 
用 温度 较 高 的 空气 ， 在 任何 一 种 情况 下 ,冷却 水 都 会 被 输送 到 计算 机 机 房 空调 单 
元 (CRAC， 也 称 为 换 热 通风 空调 单元 ) 以 便 和 循环 空气 进行 热 交 换 。 然 后 ， 提 
供给 服务 融 机 柜 的 冷却 空气 将 有 助 于 吸收 从 服务 器 必 片 散热 融 散 发 出 来 的 热量 。 
有 一 个 研究 专注 于 为 数据 中 心 提 供 土木 建筑 和 计算 机 房 冷 却 解 决 方案 ， 同 时 ， 还 
有 大 量 的 工作 专注 于 研究 减轻 热量 的 产生 ， 以 及 通过 新 的 系统 和 数据 中 心 的 应 用 
管理 实现 更 经 济 更 有 效 的 散热 。 


5.5.1 数据 中 心 的 热 耗 特征 与 性 能 指标 


一 些 研究 主要 集中 在 通过 监控 数据 中 心 内 的 气流 来 理解 热量 之 间 的 相互 作 
用 ， 因 为 气流 会 从 服务 器 中 把 热量 带 走 。 为 此 ， 已 经 提出 了 使 用 分 布 式 温度 传 感 
ar?! 。 在 该 研究 中 ， 考 虑 了 典型 数据 中 心 的 布置 ， 会 产生 如 下 所 述 的 热 空气 流 
动 : Hi CRAC 单元 提供 的 冷却 气流 从 机 架 前 端 进入 服务 咒 ， 并 且 当 其 流 过 装 有 服 
务 器 和 接口 芯片 的 机 箱 时 被 加 热 ， 热 空气 被 CRAC 单元 的 进 气 口 吸 进 气流 的 返回 
通道 。 类 似 于 世 片 内 部 相 邻 物理 区 块 之 间 的 热传导 耦合 ， 在 数据 中 心 内 同样 存在 
热量 之 间 的 相互 耦合 作用 。 从 一 个 通道 离开 的 热 空气 可 以 进入 另 一 个 通道 内 的 机 
架 。 通 过 板 载 的 进口 “出口 温度 传感器 的 监控 ， 这 种 复杂 的 热量 之 间 的 相互 作用 
可 以 很 好 地 得 到 解释 并 实施 预防 措施 ， 从 而 建立 热 模型 用 来 捕捉 这 种 现象 。 每 次 
在 机 架 中 使 用 给 定 的 功率 分 布 ， 该 模型 可 以 预测 出 冷却 效率 较 低 的 位 置 。 同 时 该 
模型 也 可 以 预测 一 些 服务 器 的 位 置 ， 这 些 局 部 位 置 需要 采用 更 加 严格 的 热 缓解 措 
施 以 维持 所 有 服务 器 出 风口 温度 的 均匀 性 。 这 将 有 助 于 避免 在 整个 数据 中 心中 对 
所 有 的 服务 器 采取 处 理 措施 或 者 提升 整个 数据 中 心 的 冷却 能 力 。 利 用 服务 天 的 板 
载 温 度 传感器 收集 到 的 数据 ， 可 以 创建 一 个 基于 CFD 的 一 次 性 离线 仿真 模型 ， 
用 于 模拟 数据 中 心 内 的 热量 循环 。 通 过 CFD 建 模 工具 对 这 些 数据 进行 拟 合 ， 对 
于 静态 设计 的 数据 中 心 内 具有 代表 性 的 工作 负载 ， 从 而 得 出 一 个 “交叉 干扰 系 
数 ”。 然 后 ， 将 这 些 系 数 用 于 简单 热 分 析 模 型 中 ， 在 数据 中 心 运行 时 可 以 对 空气 
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入 口 温度 偏 高 的 异常 服务 器 进行 快速 预测 [3] 。 

男 一 个 类 似 的 研究 使 用 离线 实验 的 方法 来 表征 数据 中 心 内 的 热力 学 相互 作 
用 ， 并 提出 了 通过 温度 分 布 来 调度 工作 负载 的 具体 方法 :5 。 这 种 热 感知 工作 负 
载 调 度 算法 主要 遵循 以 下 两 个 指导 : (D 确 保 所 有 服务 器 的 入 口 温度 受 温度 安全 阐 
值 的 约束 ; @) 确 保 空 气温 度 在 满足 冷却 要 求 的 条 件 下 达到 最 高 ， 使 得 CRAC 单元 
的 运行 效率 得 到 提升 ， 运 行 成 本 实现 最 低 。 与 上 述 方法 类 似 ， 有 效 管理 入 口 温度 
的 关键 在 于 确保 高 温 服务 器 和 低温 服务 器 之 间 的 热 循环 最 小 化 。 在 数据 中 心中 闭 
备 大 量 的 温度 传感器 ， 通 过 温度 传感器 可 以 测量 服务 器 活动 产生 的 热量 和 排出 的 
热量 。 此 外 ， 根 据 这 些 热量 数据 ， 还 可 以 得 出 数据 中 心中 高 低温 服务 器 之 间 循 环 
热量 的 大 小 ， 进 而 得 出 工作 负载 的 参考 基线 。 将 一 些 服 务 器 聚集 组 成 集群 ， 称 为 
“Pod”， 以 限制 校准 操作 的 复杂 性 ， 并 且 能 够 在 数据 中 心 的 局 部 位 置 产 生 可 容易 
测量 的 热量 以 区 分 出 热量 循环 的 影响 。 对 于 每 个 Pod j， 热 量 循环 因子 (HRF) 
计算 如 下 : 


Que 
FO, QURE Qi 分 别 表示 由 基准 实验 中 的 参考 工作 负载 产生 的 热量 以 及 由 最 大 化 
该 特定 Pod 中 服务 器 CPU 利用 率 的 第 二 个 实验 产生 的 热量 ;，Q8* 和 0 党 分 别 表 示 
在 基准 实验 和 第 二 个 试验 过 程 中 的 循环 热量 。 如 果 没 有 热量 循环 ， 所 有 服务 器 的 
和 人口 温度 将 等 于 CRAC 单元 提供 的 空气 的 温度 。 然 而 ， 实 际 上 由 温度 传感器 测量 
出 的 非 “ 零 ”温度 差 有 助 于 得 出 循环 热量 的 大 小 。 

所 提出 的 工作 负载 调度 器 将 功率 按照 一 定 的 比例 分 配给 每 个 Pod， 该 分 配 比 
例 与 该 Pod WY HRF 占 所 有 Pod 总 HRF 的 份额 成 正比 。 因 此 ， 由 于 部 署 位 置 的 原 
因 或 者 由 于 高 度 活跃 的 邻近 服务 器 的 原因 ， 从 冷却 能 力 角 度 处 于 劣势 的 服务 器 其 
工作 负载 相对 较 小 ， 以 减轻 它们 局 部 的 散热 。 后 来 ， 这 项 研究 被 扩展 到 包括 基于 
在 线 学 习 技术 ， 以 消除 离线 校准 步骤 [51]。 

诸如 前 面 讨论 过 的 使 用 机 柜 来 放置 服务 器 的 那些 空气 冷却 系统 ， 通 常 使 用 高 
架 地 板 ， 打开 底部 作为 和 人口， 顶部 作为 出 口 ， 因 此 存在 热量 循环 的 问题 。 另 一 方 
面 ， 水 冷却 系统 构造 为 一 个 密闭 的 外 党 ， 可 通过 连接 到 制冷 机 组 单元 和 水 泵 的 水 
管 进行 连接 。 这 种 水 冷却 系统 的 热 特 性 表现 为 利用 温度 传感器 报告 CPU 的 温度 ， 
以 评估 不 同 的 冷却 液体 流量 条 件 下 的 冷却 效率 [了 2] 。 一 个 服务 器 机 柜 内 安装 有 16 
个 1U 的 Dell 服务 器 ， 每 台 服 务 器 最 大 散热 功 耗 为 450W， 安 装 在 机 柜上 的 风扇 
可 以 使 机 柜 内 部 的 冷却 空气 循环 流动 ， 由 服务 器 的 散热 器 返回 的 热 空气 通过 管道 
被 传送 到 内 部 的 热 交 换 器 。 热 交换 器 的 效率 被 量化 为 两 个 温度 差 的 比值 ， 电 空气 
出 口 与 入 口 之 间 的 温度 差 ，@@ 进 水 口 和 进 气 口 之 间 的 温度 差 。 


(5. 15) 
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Tar E Tair 
out in 
m ater air (5. 16) 
n TS Tin 


该 项 研究 显示 ， 随 着 水 流量 降低 到 最 大 值 的 57% 和 42% ， 热 交换 器 的 效率 
分 别 从 基准 线 0. 83 下 降 到 0.75 和 0. 66。 
上 述 研究 中 研究 的 热 交 换 器 ,冷却 主要 基础 设施 的 设计 和 建 模 对 于 热 规划 的 
成 本 效益 是 十 分 重要 的 。 另 一 项 研究 为 热 感知 数据 中 心 的 设计 指导 和 优化 目标 提 
供 了 更 加 宽泛 的 系统 级 思维 方式 :3”] 。 第 一 项 研究 结果 就 是 每 个 数据 中 心 都 有 一 
个 特定 分 布 的 温度 蓝图 ， 就 像 处理 器 芯片 一 样 ， 其 具有 通常 出 现 的 热点 位 置 。 如 
果 识 别 出 这 些 位 置 ， 则 可 以 对 机 柜 进 行 排列 并 且 将 机 柜 区 分 为 相互 交替 的 热 通道 
和 冷 通道 ， 并 通过 适当 的 工作 负载 分 配 来 消除 这 种 不 平衡 。 冷 却 单元 过 热 和 过 大 
的 热 应 力也 可 能 导致 冷却 故障 和 昂贵 的 停机 时 间 。 智 能 数据 中 心 管理 系统 可 能 会 
将 机 架 的 工作 负载 进行 重新 分 配 定位 ， 因 为 这 些 机 架 可 能 因为 这 些 故障 导致 停 
机 。 该 研究 认为 ， 为 了 实现 上 述 任何 一 种 技术 ， 需 要 精确 地 将 热 事 件 与 系统 事件 
之 间 的 关联 性 进行 精准 监控 。 该 研究 还 指出 ，VMM 将 在 促进 热 感 知 工作 负载 管 
理 方 面 发 挥 重 要 作用 。 
事实 上 ， 大 量 的 调查 研究 主要 集中 在 系统 工作 负载 的 分 配 以 控制 数据 中 心 内 
热量 的 分 布 。 类 似 于 前 面 讨论 的 ， 大 多 数 方法 需要 依赖 于 热 监控 对 数据 中 心 进行 
表征 。 其 中 一 种 方法 是 使 用 热 监控 方法 ， 指 出 数据 中 心中 的 哪些 位 置 更 容易 冷 
却 ， 使 得 更 大 的 工作 负载 可 以 集中 在 这 些 区 域 ':*]。 这 种 工作 负载 分 配方 法 是 由 
商业 数据 中 心 内 的 坊间 数据 和 学 术 实 验 研 究 的 批 处 理 作业 服务 器 推动 的 ， 这 显著 
地 表明 存在 很 大 一 部 分 低 利 用 率 的 时 间 。 这 就 支持 了 在 数据 中 心 内 可 以 存在 工作 
负载 的 迁移 ， 而 不 用 担心 物理 资源 争夺 的 问题 。 引 入 了 一 个 新 的 效率 指标 来 指导 
工作 负载 的 分 配 问题 ， 该 指标 有 助 于 定义 数据 中 心 的 组 织 结构 (如 气流 出 口 、 
入 口 、 通 风 地 板 、 冷 热 通道 之 间 的 隔离 等 ) 与 数据 中 心 内 CRAC 单元 位 置 之 间 
的 冷却 动力 学 。 热 关联 指数 定义 :1 如 下 : 
AT, 
TCh uns = p (5.17) 
该 指数 表示 作为 对 第 7 个 CRAC 单元 引起 的 温度 变化 A7T,,,。; 的 响应 ， 在 第 i 
个 机 架 入 风口 处 测量 的 温度 变化 ， 可 以 使 用 经 过 校准 的 温度 传感器 评估 出 数据 中 
心中 每 个 CRAC 单元 的 热 关 联 指数 。 利 用 这 个 指标 和 一 些 类 似 研 究 中 评估 的 热 空 
气 循环 概念 ， 从 而 可 以 得 出 一 个 更 普遍 性 的 指数 ， 即 本 地 工作 负载 分 配 指数 
(LWPI) ， 以 确定 每 个 服务 器 i 的 某 种 工作 负载 分 配 所 获得 的 收益 。 
Tan Tart A an aaa) AT 
To sq 


eff 
in,i airSupply ,i 


该 指标 使 用 从 位 于 每 个 服务 器 i 和 CRAC 单元 附近 的 多 个 内 置 温度 传感器 收 


LWPI, = (5. 18) 
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集 的 测量 结果 来 计算 以 下 各 项 

Ti Ta: 当前 服务 器 入 风口 温度 与 从 最 近 的 送 风 地 板 输送 到 该 位 置 
的 空气 温度 之 间 的 差 值 。 

T, -Tp 入 风口 温度 传感器 设 定 的 最 大 上 限 值 与 服务 器 温度 传感器 测量 到 
的 当前 入 风口 温度 之 间 的 差 值 。 

Ts — Tursun nin? 由 CRAC 单元) 提供 的 空气 温度 与 CRAC 单元 能 够 提 
供 的 最 低空 气温 度 之 间 的 差 值 。 对 于 每 个 CRAC 单元 单独 计算 该 温度 差 值 ， 并 且 
使 用 在 服务 器 i 和 CRAC 单元 j 之 间 定 义 的 各 自 TCI 指数 来 计算 加 权 和 。 

该 指标 已 经 专门 用 于 确定 CPU 密集 型 批 处 理 作业 的 分 配 ， 通 过 估算 作业 长 
度 来 得 出 静态 调度 方案 。 在 计算 密集 型 作业 中 ， 那 些 具有 最 长 运行 时 间 的 作业 被 
分 配给 具有 最 佳 LWPI 指标 的 服务 器 。 

另 一 种 方法 集中 在 使 用 线性 热 循环 模型 优化 服务 器 入口 温度 ， 以 实现 能 量 最 
优 的 任务 分 配 [ss] 。 然 后 ， 分 别 通过 使 用 遗传 算法 方法 和 顺序 二 次 规划 方法 两 种 
替代 方法 来 解决 任务 分 配 问 题 。 该 方法 可 以 得 出 使 用 冷冻 水 冷却 的 数据 中 心 的 性 
能 系数 是 送 风 温度 的 函数 ， 即 

COP(T) = 0.00687? + 0. 00087 + 0. 458 (5. 19) 

由 于 CRAC 单元 提供 冷 量 所 消耗 的 能 量 与 其 送 风 温度 成 正比 ， 因 此 在 机 架 人 
风口 温度 未 超过 温度 闵 值 的 情况 下 ， 以 最 低 送 风 温 度 运行 系统 ， 预 计 将 提供 最 侍 
能 效 的 冷却 解决 方案 。 服 务 器 机 架 入 风口 温度 超过 的 上 限 温度 点 也 称 之 为 红线 。 
数据 中 心 内 的 工作 负载 分 配 可 以 被 模拟 为 某 个 作业 任务 的 分 配 ， 该 作业 任务 使 用 
第 “个 服务 器 刀片 ， 而 机 箱 中 一 共 可 容纳 六 (>c) 个 刀片 。 由 于 工作 负载 的 这 
种 分 配 ， 机 箱 ;内 的 散热 功 耗 可 以 用 一 个 线性 函数 模型 来 表示 ， 其 中 对 于 每 个 机 
箱 都 采用 一 个 系统 空闲 功 耗 7 作为 功 耗 基线 ， 此 外 对 于 每 个 有 任务 运行 的 刀片 使 
用 一 个 恒定 功 耗 a. 


P,=b+c,a (5. 20) 

对 于 一 个 给 定 的 任务 分 配 向 量 c， 系 统 内 所 有 机 箱 的 进 风 温度 向 量 都 可 以 用 

一 个 线性 组 合 模型 来 表示 。 该 线性 组 合 由 机 箱 各 自 最 近 的 CRAC 单元 送 风 温度 和 

数据 中 心 的 功 耗 向 量 组 成 。 因 此 ， 该 模型 即 考虑 了 机 箱 i 内 的 本 地 散热 ， 又 考虑 
了 来 至 其 他 所 有 机 箱 的 循环 热 空 气 市 来 的 次 要 影响 。 该 模型 表示 如 下 : 

T,,(c) = Thirsupply + Db + Dea (5. 21) 

动态 学 习 方 法 也 被 用 于 推断 数据 中 心 冷却 系统 的 物理 网 络 结构 ， 从 而 对 服务 

器 的 温度 进行 预测 1%] 。 这 种 方法 有 助 于 提前 警告 管理 系统 即将 发 生 的 热 紧 急事 

件 ， 从 而 可 以 尽早 采取 预防 措施 。 


5.5.2. 系统 层 热 感知 管理 的 软件 环境 与 配置 
鉴于 我 们 对 数据 中 心 热 行为 的 物理 特性 以 及 可 用 的 管理 和 重新 分 配 工作 负载 


第 5 章 系统 层 、 超 级 计算 机 以 及 数据 中 心 层 热 事 件 的 缓解 措施 


的 软件 工具 的 理解 ， 有 些 提 议 集中 于 这 些 管 理 软件 环境 的 有 效 实施 。 其 中 一 个 建 
议 是 在 物理 基础 设施 和 管理 数据 中 心 的 软件 系统 之 间 建 立 无 缝 的 融合 '”] 。 系 统 
层 的 两 个 主要 功能 ， 即 任务 调度 器 和 进程 迁移 工具 已 经 得 到 了 加 强 ， 以 考虑 到 服 
务 器 内 的 自身 加 热 和 各 服务 吉之 间 的 热 循环 。 软 件 环境 利用 板 载 的 和 人口 和 出 口 温 
度 传感器 ， 并 且 创 建 了 温度 传感器 读数 数据 库 。 数 据 库 中 收集 到 的 历史 温度 数 
据 ， 用 于 任务 调度 器 的 短期 决策 ， 同 时 也 用 于 外 部 策略 控制 咒 以 评估 较 长 时 间 内 
的 趋势 。 任 务 调度 器 可 以 利用 入 口 温度 数据 来 执行 新 的 策略 ， 比 如 随 着 服务 器 入 
口 温 度 的 升 高 ， 逐 渐 降 低 该 服务 器 接收 新 任务 的 优先 级 。 服 务 器 节点 的 作业 优先 
权 也 可 以 有 条 件 地 与 超过 某 个 阐 值 的 节点 入 口 温度 绑 定 在 一 起 。 在 系统 的 更 高 层 
面 上 ， 各 种 热 感 知 动作 的 触发 温度 国 值 可 以 由 策略 控制 如 在 较 长 的 决策 时 间 间 隔 
内 持续 地 监控 和 调整 。 

钉 扎 方法 已 经 被 研究 用 于 作为 任务 均衡 的 一 种 选择 方案 ， 以 便 能 够 主动 地 对 
系统 进行 热管 理 。 该 方法 可 以 影响 系统 任务 对 服务 器 选择 的 黏 性 [3%] 。 事 实 上 ， 
由 于 其 入 口 温度 传感器 读 取 的 温度 过 高 而 需要 进行 干预 的 服务 器 要 将 计算 密集 型 
任务 钉 扎 到 其 他 服务 器 ， 以 避免 在 一 定 的 时 间 段 内 额外 的 计算 负载 。 

在 给 定 的 时 间 确 定 活 动 服 务 需 集群 以 达到 最 佳 热 分 布 ， 从 而 实现 数据 中 心 的 
最 小 冷却 能 量 消耗 的 任务 已 经 被 制定 ， 并 进一步 用 系统 的 方法 进行 研究 [1 ， 此 
问题 也 被 称 为 服务 器 的 配置 。 当 纯粹 只 是 针对 数据 中 心 能 耗 节 省 时 ， 这 种 技术 也 
是 有 效 的 。 提 供 足 够 数量 的 服务 器 以 满足 QoS 的 需求 ， 而 其 余 服 务 器 可 以 被 置 
于 空闲 模式 以 实现 功 耗 的 节省 是 一 种 有 效 的 方法 。 将 热 感知 技术 纳入 到 这 个 功 耗 
管理 方案 ， 使 其 服务 于 一 个 新 的 目的 。 在 这 项 特别 的 研究 中 ， 热 感知 配置 的 问题 
已 被 表达 成 一 个 非 线 性 最 小 -最 大 二 进 制 整数 规划 问题 ， 并 用 各 种 局 发 式 方法 进 
行人 研究。 虽然 主要 的 决策 变量 是 用 二 进 制 变量 来 表示 给 定时 间 内 是 否 选择 给 定 的 
服务 器 ， 但 是 由 于 CRAC 能 效 的 非 线 性 特性 是 服务 器 活动 量 的 函数 ， 因 此 把 非 线 
性 引入 到 了 该 问题 中 。 

数据 中 心 由 于 其 商业 上 的 重要 性 和 大 范围 的 部 署 ， 在 高 性 能 计算 系统 领域 中 
一 直 处 于 关注 的 中 心 ， 大 规模 计算 技术 正在 向 百 亿 亿 级 计算 系统 发 展 。 现 代 超级 
计算 机 是 这 些 系统 的 前 身 ， 并 且 它 们 正高 速 发 展 ， 全 世界 范围 内 大 量 的 计算 系统 
文 持 着 重要 的 科学 发 现 ， 并 引起 社会 的 关注 。 超 级 计算 机 自然 也 承受 着 与 商业 数 
据 中 心 相 同 的 制冷 能 量 的 开销 和 可 靠 性 问题 。 也 许 ， 对 于 数据 中 心 的 相关 研究 ， 
热管 理 变 得 更 加 的 突出 ， 因 为 企业 对 数据 中 心 的 总 拥有 成 本 (TCO) 是 一 个 更 加 
关心 的 问题 。 然 而 ， 在 超级 计算 机 上 部 署 的 现代 多 核 芯片 中 ， 热 管理 引发 的 可 靠 
性 和 性 能 下 降 开 始 威胁 到 这 些 系统 预期 的 峰值 性 能 。 同 时 ， 在 超级 计算 机 中 实现 
更 高 能 效 的 运行 是 不 可 避免 的 ， 因 为 从 近期 的 许多 系统 可 以 看 出 ， 人 们 正在 考虑 
无 制冷 机 组 的 水 冷 系统 [51] 。 
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最 近 的 一 项 研究 介绍 了 高 温水 冷却 超级 计算 机 的 热 分 析 模 型 和 控制 系统 ， 以 
最 小 泵 功率 来 管理 冷却 系统 !%] 。 控 制 器 控制 管理 冷却 水 的 最 佳 温度 ， 以 便 在 可 
行 的 情况 下 ， 利 用 温水 而 不 是 冷却 水 来 冷却 系统 。 通 过 总 结 分 析 两 个 服务 器 节点 
上 的 主要 活动 ， 以 整体 的 方式 利用 系统 分 析 模 型 来 研究 系统 的 活动 状态 .计算 
系统 与 泵 之 间 的 热 交 换 器 ; @) 蒸 发 器 回路 上 的 热 交 换 器 。 这 两 个 结构 在 系统 方程 
中 由 热传导 的 有 效 热 阻 来 表示 ， 该 系统 方程 最 终 描述 了 冷却 剂 入 口 与 出 口 之 间 的 
温度 差 。 比 如 流量 、 阀 门 位 置 ， 以 及 制冷 机 组 提供 的 冷却 水 最 低温 度 ， 所 有 这 些 
控制 参数 都 是 由 所 提出 的 算法 来 控制 。 热 分 析 模 型 用 于 为 系统 指定 热 约束 条 件 ， 
成 本 函数 的 优化 问题 涉及 泵 和 制冷 机 组 的 功率 消耗 以 及 它们 各 自 的 权重 因子 ， 该 
权重 因子 可 以 根据 系统 的 优先 级 进行 调整 。 然 后 ， 可 以 应 用 各 种 启发 式 方法 动态 
地 解决 这 些 问题 。 
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第 6 草 
热 感 知 系统 的 发 展 趋势 


热效应 的 影响 首次 被 关注 时 ， 是 由 于 它们 同 功 耗 、 性 能 、 可 靠 性 ， 以 及 布置 
在 高 性 能 系统 中 集成 电路 散热 需求 有 直接 关系 。 随 着 这 一 现象 关注 度 越 来 越 高 ， 
各 种 其 他 方面 因素 也 开始 作为 重要 的 设计 考虑 点 。 一 个 最 突出 的 例子 是 用 户 如 何 
物理 感知 电子 设备 的 发 热 ， 特 别 是 移动 和 手持 设备 用 户 。 关 于 这 方面 的 男 一 个 研 
究 方 向 是 ， 由 于 有 些 系统 的 发 热量 变 得 非常 大 ， 以 至 于 人 们 开始 谈论 将 热 收集 起 
来 再 转化 成 电能 。 热 回收 是 一 个 非常 大 的 领域 ， 在 各 种 宏观 和 微观 尺度 的 系统 中 
有 大 量 的 应 用 。 关 于 热 回 收 技术 的 详细 探讨 ， 已 经 超出 了 本 书 的 范围 。 本 章节 将 
介绍 一 些 最 新 进展 ， 特 别 是 针对 集成 于 蕊 片 内 部 的 热 回收 技术 也 会 被 提 到 。 男 一 
条 新 兴 方 法 是 针对 蕊 片 内 置 温 度 测量 设备 研发 新 型 材料 、 开 发 新 的 设计 方案 。 最 
终 ， 系 统 生成 的 热 以 及 集成 电路 内 产生 热 的 原理 ， 都 可 以 通过 一 个 完全 不 同 的 视 
角 来 观察 到 ， 从 而 推导 出 对 集成 电路 的 结构 和 运行 有 价值 的 信息 。 利 用 热 特性 确 
保 集成 电路 安全 以 及 识别 出 潜在 风险 是 一 个 令 人 感 兴趣 的 领域 ， 并 值得 在 本 书 的 
结论 中 提 到 。 


6.1 热 设 计时 考虑 客户 舒适 度 


移动 设备 的 表 壳 温度 对 用 户 体验 有 非常 直接 的 影响 。 手 持 设备 〈 例 如 手机 ) 
内 部 的 功率 管理 方案 会 导致 设备 充 温 非常 快速 的 上 升 ， 并 超过 用 户 许可 的 限 值 。 
另外 ,不 同 用 户 对 表 壳 温度 的 敏感 度 会 明显 不 同 。 通 常 在 长 期 使 用 过 程 中 ， 用 户 
主要 接触 设备 的 位 置 为 后 帝 以 及 屏幕 。 因 此 ， 这 部 分 热 耗 对 用 户 体 验 有 非常 直接 
的 影响 。 当 接触 物体 的 温度 超过 45% 时 口 2] ， 大 多 数 人 都 会 产生 热 痛觉 ， 这 在 
移动 设备 中 是 显而易见 的 。 有 一 些 已 报道 的 案例 会 导致 移动 设备 外 过 温度 升 高 ， 
如 当 玩 图 形 密 集 型 游戏 时 ， 据 报道 最 高 热点 温度 能 达 47% FI。 实际 上 ， 在 一 些 
智能 手机 中 过 温 是 常见 现象 15] 。 

智能 手机 产品 对 于 更 加 精细 的 热管 理 需 求 ， 包 括 用 户 体 验 的 特殊 需求 ， 已 经 
在 产业 领域 开始 被 重视 .中 。 人 们 首先 尝试 通过 提高 设备 的 热 结 构 特性 ， 减 小 热 
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挑战 。 例 如 研究 智能 手机 外 壳 不 同 材 料 和 不 同 尺 十 的 影响 ， 如 本 章 参考 文献 
[7] 所 述 。 利 用 不 同 功 耗 范围 来 表征 智能 手机 在 不 同 条 件 下 的 工作 载荷 (如 自 
由 空气 中 、 被 人 手持 、 放 在 衣服 的 口袋 里 等 等 ) ， 从 而 评估 出 各 种 形状 外 壳 的 热 
响应 特性 。 

其 他 的 一 些 研究 ， 旨 在 针对 这 些 设 备 及 其 相关 的 热 仿 真 /模拟 环境 ， 构 建 一 
个 等 效 热 模型 。 其 中 一 项 研究 建议 一 个 热 分 析 工 程 师 ， 针 对 整个 智能 手机 包括 外 
壳 构 建 一 个 稳 态 的 温度 图 [$1 。 另 一 项 研究 ， 则 描述 了 应 用 处 理 器 和 电池 之 间 的 
TUR US 

最 新 发 展 主要 集中 在 设计 更 好 的 智能 手机 系统 级 热管 理 方法 ， 以 实现 更 好 的 
用 户 体验 ， 而 且 不 需要 改变 任何 硬件 设计 。 该 研究 '' 中 阐述 了 不 同 用 户 对 于 温度 
的 不 同感 知 。 此 项 研究 中 ， 实 验 被 放 在 一 台 已 经 商业 化 且 运 行 安利 OS. 的 智能 手 
机 上 进行 。 智 能 手机 内 植 和 人 两 个 温度 传感器 ， 分 别 监控 CPU 和 电池 的 温度 。 除 
此 之 外 ， 在 手机 外 壳 背 部 也 植 人 两 个 传感器 (上 部 和 中 部 )， 并且 在 屏幕 上 植 入 
一 个 传感器 ， 利 用 这 些 传感器 ， 可 以 通过 软件 周期 性 记录 系统 信息 如 CPU 的 温 
度 、 电 池 温 度 、CPU 利用 率 、CPU 频率 等 。 

一 项 针对 用 户 的 研究 ， 邀 请 了 10 个 人 参与 包括 5 名 男性 和 5 名 女性 ， 他 们 
当中 既 有 大 学 毕业 生 也 有 大 学 在 校生 。 首 先 ， 这 些 研究 对 象 被 要 求 手持 智能 手 
机 ,一旦 手机 的 党 温 让 他 们 感觉 到 不 可 接受 ， 他 们 要 及 时 上 报 。 实 验 对 象 中 ， 最 
长 的 忍耐 时 间 为 7min。 这 同 现 实 中 的 应 用 场景 是 一 致 的 ， 用 户 接触 手机 外 壳 的 
平均 时 间 很 容易 就 能 达到 数 分 钟 。 实 验 中 ， 在 智能 手机 上 运行 一 个 执行 计算 的 重 
载 基准 程序 。 尽 管 CPU 的 温度 不 会 超过 设 定 的 冰 值 (一 旦 超过 了 该 阔 值 ， 系 统 
内 植 人 的 功 耗 管理 系统 就 会 进行 干预 ) ， 但 是 对 于 所 有 研究 对 象 而 言 ， 引 起 壳 体 
温度 超过 人 体 舒 适 温度 时 的 热 状 态 都 是 相同 的 。 实 验 的 另 一 个 重要 结论 是 ， 每 个 
用 户 对 于 温度 的 感受 度 是 不 一 样 的 。 如 图 6. 1 所 示 ， 实 验 对 象 感觉 到 手机 温度 超 
过 人 体 舒 适 温度 时 ， 最 低 壳 温 为 34. 0% ， 最 高 壳 温 为 42. 8%C 。 

为 了 解决 因 热 引起 用 户 不 舒适 的 问题 ， 一 个 用 于 控制 壳 温 的 系统 级 管理 方案 
被 提出 1 中。 方案 中 用 到 的 第 一 个 元 件 为 系统 级 壳 温 预测 模型 。 基 于 从 热 测 量 中 
获取 实验 数据 以 及 通过 安 卓 0S 收集 到 的 性 能 指示 器 数据 来 构建 预测 模型 。 通 过 
在 一 台 测 试 的 智能 手机 上 外 接 热 敏 电 阻 ， 获 取 外 过 和 屏幕 温度 测量 值 ， 获 取 的 温 
度 读 值 被 用 作 外 壳 温 度 和 屏幕 温度 的 设计 期 望 值 。 同 时 ,通过 OS 将 CPU 的 温 
WE. CPU 利用 率 以 及 时 钟 频率 收集 在 日 志文 件 中 。 利 用 日 志文 件 中 的 数据 作为 
训练 数据 ， 各 种 机 器 学 习 方法 被 用 于 构建 运行 壳 温 模型 ， 包 括 线性 回归 、 多 层 感 
知 、M5P， 以 及 REPtree。 在 所 有 模型 上 进行 的 验证 表明 ， 同 其 他 的 方法 相 比 ， 
线性 回归 和 多 层 感知 的 精度 较 差 。 精 度 会 被 测量 ， 并 作为 期 户外 这 温度 同 预测 外 
过 温度 之 间 的 百分比 误差 〈 期 望 外 壳 温 度 是 通过 上 述 测试 用 的 外 接 热 敏 电阻 读 
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图 6.1 一 项 用 户 研究 表明 ， 对 于 智能 手机 的 壳 温 和 屏幕 温度 ， 
不 同 的 用 户 对 舒适 温度 的 要 求 会 不 同 [0 


值 归 纳 总 结 得 出 的 ) 。M5P 和 REPtree 模型 可 以 提供 接近 100% 的 准确 估计 。 对 
于 外 壳 温 度 估计 ， 最 好 的 情况 下 ，REPtree 模型 平均 偏差 为 0.95% , MSP 算法 则 
有 0.96% 的 偏差 。 但 是 ， 当 小 于 1C 的 温度 差 值 被 忽略 时 (由 于 人 体 无 法 感知 如 
此 小 的 温度 偏差 ) ，M5P 算法 能 给 出 更 好 的 估算 结果 ， 因 此 最 终 MSP 算法 被 导入 
IZE OS 中 ， 作 为 动态 功 耗 管理 模型 的 一 部 分 。 

接 下 来 ， 这 项 研究 评估 了 MSP 算法 的 另外 一 种 应 用 场景 ， 将 MSP 的 算法 导 
人 到 手机 功 耗 管理 器 一 一 DVFS 机 制 闭环 回路 中 。DVFS 系统 采用 MSP 算法 模型 ， 
确保 壳 温 在 用 户 的 期 望 阔 值 以 下 从 而 降低 不 舒适 度 。 通 过 实验 测试 了 这 项 特殊 的 
研究 ， 将 用 户 们 的 平均 期 望 闪 值 作为 默认 值 ， 并 将 默认 值 用 作 每 个 应 用 程序 接口 
的 独立 阔 值 。 管 理 方案 每 隔 3s 预测 一 次 壳 温 ， 仅 仅 当 壳 温 需要 被 控制 时 ， 系 统 
管理 方案 才 会 介入 并 执行 DVFS 决定 。 另 外 ， 智 能 手机 OS 的 基准 DVFS 仅仅 只 
用 来 优化 功 耗 。 基 准 DVFS 是 默认 的 安 续 按 需 管理 器 ， 它 会 根据 CPU 的 利用 率 
来 调整 处 理 器 频率 。 当 利用 率 最 高 时 ， 处 理 器 的 频率 也 被 设置 为 最 高 等 级 。 假 如 
利用 率 非 常 低 ， 频 率 可 以 急剧 下 降 ; 或 者 当 利用 率 低 于 阔 值 (80% 左右 ) 但 是 
高 于 最 低 值 (20% 左右 ) 时， 频率 可 以 逐步 降低 。 研 究 中 用 到 的 一 个 典型 的 智 
能 手机 的 频率 在 几 百 MHz 和 2GHz 之 间 ， 并 被 分 成 12 个 等 级 。 

用 户 对 壳 温 舒适 度 的 感知 控制 机 制 有 一 个 冰 值 ， 它 用 于 激活 控制 机 制 。 阔 值 
被 设 为 用 户 允 许 的 最 高 壳 温 限 值 减 去 2 。 如 果 预 测 壳 温 和 壳 温 限 值 之 间 的 差 值 
在 1~2% 之 间 ， 则 最 大 允许 的 CPU 频率 会 被 降低 一 个 等 级 〈 比 如 ， 从 最 高 等 级 
降低 到 第 二 等 级 ) 。 如 果 预 测 壳 温 和 壳 温 限 值 之 间 的 差 值 在 0.5 ~ 1% 之 间 ， 则 最 
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大 允许 的 CPU 频率 会 被 降低 两 个 等 级 。 最 终 ， 如 果 预 测 壳 温 和 壳 温 限 值 之 间 的 
差 值 接近 0.5%C ， 或 者 预测 壳 温 超过 了 壳 温 限 值 ， 则 CPU 会 从 最 大 频率 直接 变 为 
最 低频 率 等 级 。 一 项 用 户 研 究 表明 ， 当 智能 手机 的 壳 温 感知 方案 能 保持 可 持续 的 
性 能 且 温 度 留 有 较 大 余 量 时 ， 它 会 深 受 用 户 青睐 。 


6.2 集成 电路 的 热 回 收 技术 


一 方面 ， 在 宏观 尺度 的 应 用 中 将 热 转化 为 电能 是 一 个 众所周知 的 概念 ， 男 一 
方面 ， 尾 片 内 置 的 微观 太 度 或 者 纳米 太 度 热 回 收 则 是 一 个 新 出 现 的 领域 。IC uS 
片 内 热点 处 产生 的 热 给 热 回 收 技术 带 来 了 机 会 。 尤 其 是 3D IC 芯片 ， 它 在 整个 侧 
表面 会 呈现 出 温度 梯度 ， 而 且 这 种 温度 梯度 可 以 保证 持续 存在 。 人 们 提出 了 一 些 
热 回收 技术 方案 ， 举 试 将 目前 高 性 能 芯片 上 产生 的 热 转化 成 电能 十 -31 。 大 量 的 
热电 材料 都 可 以 用 于 热电 回收 技术 ， 如 在 前 面 第 2 章 中 讨论 的 用 于 构建 温度 传 感 
顺 的 材料 ， 它 们 也 一 样 可 以 被 用 于 热电 回收 。 但 是 ， 目 前 已 有 的 一 些 方案 都 所在 
解决 宏观 太 度 上 的 热 回收 ， 它 们 或 者 连接 到 需 件 外 过 的 作为 离散 器 件 进 行 热 回 
收 ， 或 者 放 在 必 片 封装 底部 的 作为 非 内 置 咒 件 。 同 大 量 的 离散 装置 相 比 ， 薄 膜 以 
及 纳米 结构 的 热电 装置 被 证 明 更 加 适合 用 于 心 片 内 置 热电 回收 。 

人 们 提出 了 两 种 热电 回收 方案 : 一 种 方案 是 在 CPU 和 热 扩 展板 之 间 插 入 一 
个 热电 回收 模块 ， 或 者 在 热 扩 展板 的 延伸 部 分 放置 一 个 热电 回收 模块 '?]; 另 一 
种 热电 回收 方案 是 在 散热 带 和 忌 片 的 结 之 间 集 成 一 个 180pm 厚 的 N -P 超 品格 结 
构 的 热电 模块 加 ] 。 对 于 这 两 种 方案 而 言 ， 热 电 回收 器 只 能 利用 芯片 和 散热 器 之 
间 的 温度 梯度 进行 热电 回收 ， 由 于 散热 器 是 用 来 均匀 接触 面 的 温度 ， 因 此 该 温度 
梯度 不 可 避免 地 会 比较 小 ， 实 际 热 回收 效果 非常 差 。 男 外 ， 在 结 和 散热 带 之 间 的 
散热 路 径 上 加 入 一 个 额外 的 器 件 ， 会 对 整体 散热 效率 产生 负面 影响 。 有 一 项 研 
究 ， 它 探讨 了 一 种 插入 到 结 和 芯片 封装 之 间 的 非 必 片 内 置 热电 回收 技术 ， 它 主要 
用 于 电源 调节 电路 设计 ;4 。 但 是 该 项 研究 没有 讨论 热电 回收 的 具体 用 法 ， 以 及 
系统 具有 哪些 端 到 端的 能 力 。 同 样 地 ， 另 外 一 项 关于 利用 多 输入 平台 进行 热电 回 
收 设计 的 研究 ， 对 热电 回收 系统 如 何 同 实际 载荷 器 件 进 行 相互 作用 也 没有 给 出 任 
何 具体 的 说 明 '!] 。 本 书 参 考 文献 [13] 中 阐述 了 将 一 个 大 体积 的 热电 回收 装置 
连接 到 CPU 封装 外 膏 上 ， 利 用 热电 回收 装置 的 输出 功 耗 进行 热电 回收 。 尽 管 
N -了 超 唱 格 结构 热电 模块 已 经 作为 商业 量 产 产品 在 使 用 ， 但 是 这 些 模块 都 不 是 
集成 在 芯片 内 部 的 ， 相 反 地 它们 都 是 被 放 在 必 片 结 与 散热 器 之 间 。 

一 项 最 新 的 研究 06] 旨 在 针对 纳米 尺度 芯片 内 置 热 回收 器 建立 端 到 端的 分 
析 。 一 个 典型 的 热能 回收 系统 包括 三 个 主要 阶段 : 热电 转化 、 电 压 转化 以 及 电荷 
缓冲 。 如 图 6. 2 所 示 ， 为 一 种 利用 双人 金属 热 电 偶 进 行 热电 回收 系统 。 第 一 阶段 ， 


第 6 童 ” 热 感知 系统 的 发 展 趋 势 Xa 


一 个 双 金 属 薄 膜 热 电 偶 阵列 将 热能 转化 为 电能 ; 9G — TEE IH HUP TAL, RU 
用 电源 转化 器 收集 电能 ， 并 拉 升 电压 转化 融和 输出 的 低 电 压 值 ;第 三 阶段 为 能 量 组 
冲 器 ， 利 用 芯片 内 置 的 电容 存储 能 量 ， 并 给 一 个 负载 供电 。 能 量 缓冲 器 同时 也 是 
一 个 控制 系统 ， 它 会 针对 电源 转化 电路 生成 时 钟 信 号 BA/B'。 基 于 负载 的 用 电 情 
况 ， 控 制 电路 也 会 相应 地 控制 能 量 缓冲 器 的 充电 和 放电 。 


Hues [al ie as 
Vin NEBE |y | 芯片 内 集成 的 电 
Frc=c(Ta To) 电源 转化 器 BER UR 负载 
热电 倘 阵 列 
充电 和 放电 
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图 6.2 芯片 内 部 集成 的 热电 回收 系统 架构 图 


双 金 属 薄 膜 热 电 侦 由 两 个 金属 层 构 成 。 热 电 偶 一 个 结 为 电导 通 ， 男 一 个 结 
为 开放 端 。 任 何 通过 双人 金属 薄膜 热电 侦 的 温度 梯度 都 会 产生 热 - 冷 电压 (Virc)， 
它 正 比 于 两 个 金属 上 产生 的 塞 贝克 系数 。 当 多 个 热电 偶 串 联 使 用 时 ， 最 终 答 出 的 
电压 数值 为 每 个 热电 偶 输 出 电压 之 和 。 图 6. 3 为 布置 在 芯片 结 上 的 热 回 收 需 装置 
图 。 在 结 的 一 个 端点 与 男 一 个 端点 之 间 ， 存 在 一 个 温度 梯度 A7T。 热 电 偶 阵列 沿 
平行 于 温度 梯度 的 方向 放置 ， 因 此 每 个 热电 偶 两 结 之 间 产 生 的 温度 梯度 最 大 。 最 
终 总 的 输出 热 - 冷 电 压 〈Tac) 是 串联 连接 的 各 热电 偶 输 出 电压 之 和 。 每 个 热电 
偶 由 两 种 金属 构成 ， 分 别 为 金属 1 和 金属 2 ， 如 几 6.3 所 示 。 将 导线 从 其 中 一 个 
设备 金属 1 层 的 延伸 ， 穿 过 过 孔 连 接 到 另 一 个 设备 的 金属 2 层 ， 从 而 实现 两 个 相 
邻 设备 之 间 的 连接 。 
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图 6.3 热能 回收 器 : 每 个 薄膜 热电 偶 的 输出 电压 之 和 作为 最 终 的 输出 电压 Vye 
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尽管 每 个 薄膜 热电 偶 产 生 的 输出 电压 值 较 低 ， 但 是 由 于 实际 热电 回收 装置 
是 由 大 量 的 热电 侦 串 联 组 成 ， 所 以 最 终 会 输出 一 个 数 百 毫 伏 的 总 电压 。 最 终 的 输 
出 电压 首先 通过 转化 电路 进行 压 值 提 升 ， 然 后 被 存储 在 电荷 缓冲 器 中 。 这 需要 设 
计 一 个 开关 电容 转化 器 用 于 实现 电压 提升 9 ， 它 允许 根据 具体 的 输入 和 输出 电 
压 数 值 来 优化 转化 的 步 数 。 优 化 关系 如 式 (6.1) 所 示 ，N。 是 基于 具体 输入 和 
输出 电压 的 最 佳 电源 转化 步 数 。 例 如 ， 假 如 V. oy 0.3V. (热电 偶 阵 列 的 输出 电 
压 )，Vi 设 为 1.0V， 则 最 佳 的 转化 步骤 为 5 次 。 
| (6.1) 


电源 转化 器 的 输出 被 连接 到 能 量 缓 冲 器 ， 能 量 缓冲 带 可 以 利用 芯片 内 置 电容 
构成 。 能 量 缓冲 器 为 热电 回收 系统 的 最 后 一 步 ， 它 主要 负责 收集 和 存储 热源 上 的 
能 量 。 在 合适 的 时 间 ， 能 量 缓冲 器 会 释放 存储 的 电荷 到 应 用 负载 上 。 对 于 一 个 完 
整 的 起 片 内 置 热电 回收 系统 而 言 ， 非 常 有 必要 保持 合理 尺寸 的 能 量 转 化 器 ， 其 尺 
才 应 接近 于 世 片 结 尺 寸 。 同 时 ， 能 量 转化 器 需 要 能 存储 足够 多 的 电荷 ， 并 能 给 一 
块 有 用 的 电路 供电 。 可 以 参照 芯片 内 置 的 去 耦 电容 进行 构建 ， 典 型 芯片 内 置 去 耦 
电容 的 电容 值 在 1 ~ 162pF 之 间 5] 。 因 此 ， 峙 入 一 个 相似 尺寸 的 电荷 缓冲 器 到 
热电 回收 系统 是 理论 可 行 的 。 


6.3 芯片 内 办 温度 传感器 的 新 材料 和 新 设计 


人 们 正在 开发 用 于 蔡 换 基于 CMOS 集成 电路 咒 件 的 新 材料 ， 其 中 ， 自 旋 电 子 
元 件 最 引 人 关 注 。 同 时 ， 人 们 也 开始 研究 利用 新 技术 来 构造 新 型 温度 传 感 硕 。 一 
项 早期 研究 调查 了 温度 对 电子 自 旋 忆 阻 器 装置 的 影响 ， 并 发 现 了 两 个 明显 不 同 的 
运行 区 域 : 对 温度 敏感 的 运行 区 域 和 对 温度 不 敏感 的 运行 区 域 [8] 。 电 子 自 旋 忆 
阻 器 装置 的 一 个 特性 被 称 为 磁 畴 壁 迁移 率 ， 磁 畴 壁 迁 移 率 受 自 旋 力矩 激发 和 设备 
经 历 的 热 波动 影响 。 通 过 一 个 固定 电压 脉冲 俩 置 自 旋 忆 阻 器 装置 ， 引 起 装置 的 阻 
值 发 生变 化 。 而 且 ， 温 度 越 高 ， 在 施加 电压 脉冲 前 后 阻 值 的 变化 越 大 。 利 用 自 旋 
忆 阻 吉 装 置 的 此 特性 ， 可 用 来 设计 温度 传感器 。 

另 一 种 方案 ， 则 建议 利用 忆 阻 器 阻 值 和 温度 之 间 的 关系 来 构建 传 感 顺 ， 它 将 
基于 CMOS 电流 侦 置 电路 同 小 尺 才 忆 阻 器 元 件 耦 合 起 来 使 用 ， 测 量 温 度 造 成 的 阻 
值 变化 。 

另外 ， 还 有 一 项 最 新 的 研究 建议 采用 温度 感应 电阻 随机 存 取 存 储 器 来 实现 温 
PME CS! 。 这 是 一 个 非常 令 人 感 兴趣 的 方案 ， 它 将 一 个 单 比 特 存储 器 作为 存储 
装置 使 用 ， 同 时 也 作为 温度 传感器 使 用 。 人 们 恒 慢 将 这 种 架构 用 于 3D 堆肥 存储 
器 以 及 逻辑 集成 ， 通 过 电阻 随机 存 取 存储 器 层 测量 逻辑 层 上 产生 的 热点 温度 。 
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6.4 硬件 安全 性 


人 们 对 集成 电路 生成 热 进行 研究 的 另 一 项 兴趣 的 点 是 ， 利 用 生成 的 热量 来 表 
征 人 们 关注 的 电路 功能 变化 。 通 过 温度 监控 来 侦 测 出 硬件 木马 病毒 ， 是 此 概念 的 
其 中 一 种 应 用 。 一 项 最 新 的 研究 正 是 利用 芯片 内 集成 传感器 来 实时 侦 测 木马 病 
BET) 。 集 成 电路 功率 和 热 分 布 偏差 可 被 用 作 指示 器 ， 指 示 非 计划 /外 来 器 件 
的 侵入 ， 如 硬件 木马 病毒 。 因 为 蓄意 破坏 结构 通 各 被 设计 成 只 在 部 署 后 才 会 触发 
特定 和 不 篆 见 事件 ， 所 以 在 测试 过 程 中 通过 合适 的 测试 步骤 来 激发 和 侦 测 它们 非 
常 困 难 。 因 此 ， 实 行 连续 的 、 实 时 的 监控 是 非常 必要 的 ， 通 过 温度 传 感 融 可 以 实 
现 这 一 想法 。 在 实际 运行 中 ， 上 述 方 案 不 仅 可 以 在 测试 过 程 中 侦 测 早期 的 入 侵 ， 
并 隔离 相关 的 器 件 ， 而 且 还 可 以 进行 持续 的 温度 监控 。 利 用 测试 过 程 中 芯片 的 温 
度 特性 ， 首 先 归纳 总 结 出 一 个 关联 模型 ， 该 模型 用 于 描述 同一 芯片 内 不 同 温度 传 
感 器 之 间 的 期 望 关联 性 。 接 下 来 ， 利 用 Kalman 滤波 器 不 断 地 验证 该 关联 性 。 

另 一 项 研究 调查 了 基于 温度 来 追踪 能 量 攻 击 ， 它 又 被 称 为 旁 道 攻击 ， 主 要 有 目 
的 是 从 一 个 受 保护 的 硬件 架构 中 抽取 出 安全 信息 '3]。 特 别 需 要 指出 的 是 ， 此 项 
研究 主要 目的 是 加 密实 时 舰 入 系统 的 任务 执行 指令 。 研 究 的 主要 结论 为 不 同 任务 
执行 指令 的 温度 特性 会 明显 不 同 ， 因 此 追踪 需 可 以 利用 基于 温度 来 追踪 能 量 攻 
击 ， 进 而 推断 出 任务 执行 的 顺序 。 假 如 能 从 系统 中 抽取 总 结 出 这 些 信息 ， 就 可 以 
很 好 地 抵御 未 来 攻击 。 甚 至 可 以 重新 编排 系统 ， 从 而 关闭 或 者 打 断 这 些 已 知 的 任 
务 序列 。 任 务 调度 机 制作 为 一 种 可 能 用 于 抵御 恶意 破坏 任务 指令 的 保护 机 制 被 提 
出 ， 它 会 揭露 可 能 的 最 少 旁 道 攻击 次 数 。 保 护 机 制 首先 会 模拟 强劲 攻击 絮 的 行 
为 ， 然 后 再 执行 一 个 对 抗 任务 调度 ， 它 需要 在 揭露 信息 延迟 导入 到 调度 和 满足 调 
度 截 止 时 间 之 间 做 一 个 折 中 设计 。 

还 有 另外 一 种 侦 测 硬件 木马 病毒 的 方法 ， 它 建议 利用 2D 主 器 件 分 析 实 时 的 
温度 图 和 功 耗 图 :2 。 诊 断 网 络 通过 红外 测 温 仪 抽取 出 详细 的 芯片 温度 图 ， 然 后 
通过 热 到 功 耗 转化 关系 来 重新 构建 细 粒 度 功 耗 图 。 未 来 当 芯 片 内 内 置 的 可 用 传 感 
器 数量 达到 一 个 非常 庞大 并 能 构建 出 非常 精细 的 监控 网 络 时 ， 大 幅度 降低 木马 病 
毒 侦 测 的 测试 成 本 是 理论 可 行 的 。 
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附录 。 相关 术语 和 单位 
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输出 电压 为 : VYC (输出 电流 为 : ACT!) 
C (基于 运行 温度 范围 或 者 温度 偏 移 定义 ) 
C (ADC 的 比特 位 ) 
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起 始 温度 为 环境 温度 ， 物 体温 升 对 每 步 的 输入 功 耗 响 
应 速率 

ppm © ~! 

VK (VC-!) 

Jm K^! 
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